» » » ЧУВСТВИТЕЛЬНОСТЬ ПРОЦЕНТНОЙ СТАВКИ НА РЫНКЕ Р2Р КРЕДИТОВАНИЯ ОТ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ФАКТОРОВ

ЧУВСТВИТЕЛЬНОСТЬ ПРОЦЕНТНОЙ СТАВКИ НА РЫНКЕ Р2Р КРЕДИТОВАНИЯ ОТ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ФАКТОРОВ


ИВАН ЧЕМЯКИН
ЭКОНОМИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМ. М.В. ЛОМОНОСОВА

 

Аннотация. Статья посвящена анализу чувствительности размера процентной ставки от социально-экономических данных, которые предоставляют о себе заемщики на рынке P2P кредитования. Заемщики, выбирающие P2P площадку как альтернативу коммерческому банку делают это по следующим основным причинам: процентная ставка ниже, чем в коммерческом банке, процесс займа занимает меньше времени и требует меньшее количество документов, кроме того оформление происходит онлайн. Из всех перечисленных наиболее привлекательной для заемщика причиной является низкая процентная ставка. В ходе проведенного исследования установлено, что в 94% случаев изменение кредитного рейтинга заемщика на 1 пункт приводит к изменению ставки на 0,654%, а длина кредитной истории и цель кредита не влияют на формирование процентной ставки.

Ключевые слова: Р2Р кредитование, социальное кредитование, онлайн кредитование, процентная ставка, социально-экономические факторы.

Коды JEL классификации: D14, E34, G23.                

TCHEMYAKIN, IVAN (2015) "P2P LENDING INTEREST RATES SENSITIVITY TO SOCIOECONOMIC FACTORS". Journal of Russian Review (ISSN 2313-1578), VOL. 2(3), 1-11


1. Введение

Рынок Р2Р кредитования (People to People, прямое кредитование пользователями Интернета друг друга) – активно развивающийся сегмент индустрии Интернет финансов, возникновение которой сформулировано у Yandiev (2015). Рынок Р2Р кредитования играет ключевую роль в индустрии Интернет финансов, выступая фактически виртуальным аналогом банковской системы. В свою очередь, наиболее актуальным вопросом рынка Р2Р кредитования, также как и банковской системы, является вопрос факторов, влияющих на определение процентной ставки для заемщика.

В связи с этим цель работы – определить, какие ключевые факторы и в какой степени влияют на формирование процентной ставки на Р2Р площадке.

 
2. Обзор литературы

Первая онлайн P2P площадка под названием ZOPA (zone of possible agreement) начала работать в 2005 в Великобритании. Данную компанию можно считать прародителем онлайн P2P кредитования. Онлайн Р2Р кредитование получило научную обоснованность в течение последних 5 лет. Наличие открытого доступа к данным позволяет исследователям из разных дисциплин изучать факторы, которые влияют на онлайн процесс финансирования (Bachmann, Becker и другие, 2011).

Количество научных работ в области P2P кредитования увеличивается с каждым годом. В обзоре Alexndar Bechmann и Alexander Becker были отмечены 43 работы, которые были опубликованы с 2006 по конец 2010 года (Bachmann, Becker и другие, 2011). Yang Yang утверждает, что с 2008 года по 2015 год были опубликованы 70 научных работ (Yang Yang, 2015).

Одной из более ранних работ в области P2P  кредитования можно считать работу Hulme и Wright «Internet Based Social Lending: Past, Present and Future» (Hulme и Wright, 2006). К наиболее поздней работе можно отнести «Determinants of Defaultin P2P Lending»  (Serrano-Cinca, Gutiérrez-Nietoand López-Palacios, 2015). В целом наблюдается тенденция сужения тем исследований в области P2P кредитования.

В работе Peerto Peer Banking – State of the Art (Arne Frerichs, Matthias Schumann, 2008) дается описание существующих на данный момент бизнес моделей Р2Р  компаний  Zopa, Prosper, Smava  и даже радикально отличающихся от всех остальных компании Kiva.  Работа описывает отрасль P2P и предлагает дальнейшие темы для будущих исследований (Frerichs and Schumann, 2008).  Sebastian Moenninghoff и Axel Wieandt описывают не только Р2Р кредитование, а все возможности площадки Р2Р, позволяющие пользователю обходиться без посредника. Особое внимание авторы уделяют рискам, которые участники одноранговых сетей перекладывают на себя, отказываясь от финансовых посредников  (Moenninghoff and Wieandt, 2011).

Исследователи из разных стран  рассматривают такие вопросы, как регулирование рынка P2P кредитования (Verstein, 2011), (Chafee  и Rapp, 2012), (Zeng, 2013) и (Slattery, 2013). Эмпирические исследования поведения экономических агентов на рынке прямого кредитования направлены, в первую очередь, на изучение двух основных вопросов: риска и доходности.

Исследование риска, связанного с вложением средств на рынке прямого кредитования, чаще всего основано на эконометрической модели бинарного либо множественного выбора (Freedman и Jin, 2008), (Iyer, Khwaja и другие, 2009), (Мальцев, 2014). Применение моделей бинарного выбора в данном случае позволяет определить вклад каждого фактора в общий риск, причем риск измеряется в форме вероятности дефолта по каждому конкретному кредиту.

Второе направление эмпирических исследований рынка прямого кредитования состоит из набора публикаций, в которых построены модели, объясняющие прямо или косвенно, формирование процентной ставки по займу (Herzenstein,  Andrews и другие, 2008), (Gonzalez и Loureiro, 2014), (Wen и Wu, 2014), (Zhang, Yang и Pan, 2014). Подобные модели могут существовать в форме уравнение регрессии (Herzenstein,  Andrews и другие, 2008), в форме теоретико-игровой модели с деревом решений (Luo и Lin, 2013), а также в других формах. Наибольшей объясняющей способностью обладают модели, построенные в форме уравнений регрессии, поскольку этот тип моделей одновременно позволяет произвести факторный анализ, построить прогноз ставки процента и оценить предполагаемое качество модели в целом и прогноза

Результаты предыдущих эмпирических исследований позволяют идентифицировать основные статистически значимые факторы и выбрать наиболее удачную с точки зрения значимости и качества подгонки спецификацию модели.

 
3. Эконометрическое моделирование

Для построения эконометрической модели процентной ставки на рынке Р2Р кредитования были использованы данные о займах, размещенные на сайте компании LendingClub. LendingClub – это крупнейшая в мире online-платформа для кредитования физических лиц. Она позволяет заемщикам сформировать запрос на получение кредита, после предоставления информации о себе и запрашиваемом кредите. Все займы являются необеспеченными, и их размер варьируется в пределах от $1 000 до $35 000.

На основе кредитного рейтинга заемщика, его кредитной истории, размера запрашиваемого кредита и ряда прочих показателей LendingClub определяет процентную ставку и размер прочих платежей по кредиту. Обычно кредит выдается сроком на 3 года. Кредиты на 5 лет выдаются под более высокий процент и за дополнительную плату. Займ может быть погашен в любое время без каких-либо штрафов. Процентные ставки варьируются от 6,03% до 26,06%.

LendingClub зарабатывает на том, что взимает с заемщиков комиссию за содействие в получении кредита, а с кредиторов – комиссию за использование сервиса. Размер комиссии заемщика зависит от кредитного рейтинга заемщика и составляет от 1,1%-5,0% от суммы займа. Сервисный сбор равен 1% от суммы всех выплачиваемых заемщиком средств.

 
4. Описание переменных

Ввиду того, что на сайте компании LendingClub публикуются информация о каждом выданном кредите, а число выданных кредитов превышает 1 млн. в год, данных, собранных даже за один год, достаточно для построения надежной модели.

Всего было собрано порядка 200 тыс. наблюдений за 2014 год. Однако из всего массива данных более половины было отсеяно ввиду неполноты представленной информации. В итоге 80 тыс. наблюдений были использованы для построения модели, а 5 тыс. наблюдений – для оценки качества построенной модели.

Изначально были отобраны 12 параметров, из которых, впоследствии, были сформированы 15 регрессоров и 1 зависимая переменная. Ниже следует описание данных параметров.

1)   Процентная ставка

Как было указано ранее, процентная ставка варьируются в пределах от 6,03% до 26,06%. Однако стоит заметить, что, независимо от прочих факторов, ставка по кредиту не может быть ниже ключевой процентной ставки. В США ключевая ставка очень низкая и меняется крайне редко, поэтому для американского рынка этот аспект не является существенным, однако, в других странах ключевая ставка выше и может меняться несколько раз в год, автоматически влияя на все прочие ставки. Поэтому, было бы более логичным построить модель не самой процентной ставки, а премии по отношению к ключевой ставке. Премия рассчитывается как разница между ставкой по кредиту и ключевой процентной ставкой. В модели переменная «премия» (premium) выступает в качестве зависимой переменной и выражается в долях.

2)   Срок кредитования

Кредиты через LendingClub выдаются сроком на 3 и 5 лет. Поскольку переменная имеет только 2 дискретных значения, ее можно классифицировать как фиктивную (dummy) переменную, где кредиты, выданные на 3 года, приравниваются к 0, а кредиты, выданные на 5 лет – к 1. Срок, на который выдается кредит, представлен единственной фиктивной переменной term. Учитывая, что по правилам компании LendingClub заемщикам, запрашивающим средства на более длительный срок (5 лет), они предоставляются под более высокий процент, можно предположить, что взаимосвязь между переменной term и зависимой переменной должна быть прямой (положительной).

3)    Кредитный рейтинг

Кредитный рейтинг заемщика определяется по системе, разработанной компанией LendingClub. На основании ряда факторов заемщику присваивается группа (от А до G) и подгруппа (от 1 до 5) таким образом, что А1 – самый высокий кредитный рейтинг, а G5 – самый низкий. Присваивая рейтингу А1 число 1, А2 – 2 и так далее, получаем ранговую переменную «кредитный рейтинг» (grade), принимающую значения от 1 до 35.

Чем выше данное число, тем ниже кредитный рейтинг заемщика, тем выше должна быть ставка по кредиту, а значит, и премия к ключевой ставке процента. То есть, можно ожидать прямую (положительную) взаимосвязь между показателем grade и зависимой переменной.

4)   Форма владения жильем

Среди имеющихся форм владения жильем база данных LendingClub различает три: собственность (own), ипотека (mortgage) и аренда (rent). Большая часть респондентов имеет ипотеку. Это объясняется спецификой американского рынка: относительно доступная ипотека и социально-экономическая стабильность. Данные этого параметра были преобразованы в фиктивные переменные. Ввиду того, что параметр состоит из 3х различаемых групп, в регрессию должны быть включены 2 фиктивные переменные (home_own, home_rent) для того, чтобы не нарушать предпосылку о том, что ни одна объясняющая переменная не должна быть линейной комбинацией одной или нескольких других объясняющих переменных.

Если заемщик имеет жилье в собственности, значение фиктивной переменной home_own равно 1, а переменной home_rent – 0. Если заемщик арендует жилье, значение фиктивной переменной home_own равно 0, а переменной home_rent – 1. Если заемщик имеет ипотеку, значение обеих фиктивных переменных (home_own и home_rent ) равно 0.

5)    Цель кредита

На портале компании LendingClub заемщики запрашивают кредиты на самые разные цели, среди которых организация свадьбы, путешествия, покупка автомобиля, покрытие расходов на переезд или покупку нового жилья, реструктуризацию текущей задолженности перед прочими кредиторами. Однако в российской системе цель получения кредита определяется более широко. Поэтому из 14 представленных категорий были сформированы 6 фиктивных переменных: автокредитование (purpose_car), расходы на жилье (переезд, улучшение жилищных условий, покупка жилья; purpose_home), консолидация долга (purpose_debt_consolidation), развитие малого бизнеса (purpose_small_business), потребительское кредитование (purpose_cosumer_credit), прочее (purpose_other). Посколькуразличимыхгрупп – 6, фиктивныхпеременныхдолжнобыть 5 (purpose_car, purpose_home, purpose_debt_consolidation, purpose_small_business и purpose_cosumer_credit). Длязаемщиков, указавшихвкачествецеликредитапокупкуавтомобиля, переменная purpose_car принимаетзначение 1, апеременные purpose_home, purpose_debt_consolidation, purpose_small_business и purpose_cnsumer_credit значение 0. Аналогично для прочих 4х групп заемщиков. Если заемщик не принадлежит ни к одной из 5-ти групп (в качестве цели кредита указал «прочее»), значение всех 5-ти фиктивных переменных равно 0.

Среди заемщиков LendingClub большинство запрашивает средства на реструктуризацию долга (диаграмма №1). Это объясняется особенностью американского рынка кредитования. Этот рынок очень развит и близок гражданам, и, наверное, нет такого американца, который не имел бы какого-либо займа. Учитывая, что в среднем ставки на сайте LendingClub ниже, чем на традиционном рынке, эта возможность получения кредита становится особенно привлекательной, например, для тех, кому необходимо погасить имеющуюся задолженность перед прочими кредиторами.

 

Диаграмма 1. Распределение заемщиков по цели получения кредита

Источник данных: составлено автором по данным https://www.nsrplatform.com 

 

6)    Годовой доход

Свой годовой доход респонденты указывают в тысячах долларов США. Однако не весь указанный доход является подтвержденным. Средний доход, указанный респондентами, составляет $ 78 тыс. в год. 

Можно предположить, что с ростом дохода заемщика увеличивается его благонадежность. Однако, это не всегда так. Есть примеры того, как банкротству подвержены заемщики с чрезвычайно высокими доходами, и того, как заемщики с весьма низкими доходами ответственно исполняются условия договора. То есть однозначно установить тип взаимосвязи между уровнем дохода заемщика и его благонадежностью нельзя.

В регрессионный анализ данный параметр включен в качестве делителя в показателе debt_to_income (доля займа в доходе заемщика).

7)   Размер кредита

Размер запрашиваемого кредита ограничен. Сумма варьируется в пределах от $1 000 до $35 000. Средний размер займа – $14 600.

Можно предположить, что размер кредита должен иметь обратную зависимость со ставкой процента. То есть, чем выше сумма запрашиваемого кредита, тем ниже ставка по нему. Отметим, что в регрессионном анализе данный параметр включен в качестве делимого в показателе debt_to_income.

Чем выше доля долга в годовом доходе заемщика, тем выше уровень его кредитного риска. Соответственно выше должна быть и ставка по кредиту, а значит, и премия к ключевой ставке. То есть можно ожидать положительную взаимосвязь между показателем отношение долга к годовому доходу заемщика (debt_to_income) и премией.

8)    Занятость

Фактор занятости заемщика в базе данных LendingClub определяется числом лет, которые заемщик работает/работал на текущего/последнего работодателя. Считается, что чем дольше человек работает на одного работодателя, тем более благонадежным он является, поскольку демонстрирует способность поддерживать контрактные отношения на должном уровне. Таким образом, степень занятости должна иметь прямую взаимосвязь со ставкой процента, а значит, и с премией к ключевой ставке процента.

Особенностью базы данных LendingClub является то, что любой срок, не превышающий 1 года, указывается как «<1», любой срок, превышающий 10 лет, указывается как «10+», а любой срок от 1 года до 10 лет указывается как целое число лет. Таким образом, данный показатель не может быть представлен в качестве непрерывной переменной и должен быть преобразован в ранговую переменную, где  1 – это любой срок до 1 года, 2 – любой срок от 1 года до 10 лет, 3 – любой срок более 10 лет. Большая часть заемщиков принадлежат ко второй группе по типу занятости.

9)    Длина кредитной истории

Длина кредитной истории – это число лет с момента открытия первой кредитной линии. Однако следует обратить внимание на то, что никакой более подробной информации о ранее оформленных займах (сроках, объемах, нарушениях соглашения и т.д.) заемщик не раскрывает. Можно предположить, что длина кредитной истории также положительно влияет на благонадежность заемщика. То есть можно ожидать положительную взаимосвязь между длиной кредитной истории и премией к ключевой процентной ставке.

10)    Число запросов на получение кредита за последние полгода

Число запросов на получение кредита за последние полгода принимает значение от 1 до 6 с шагом 1. Такой показатель можно рассмотреть с точки зрения благонадежности заемщика. Можно предположить, что заемщики, которые чаще прочих обращаются к кредитованию, плохо справляются с управлением своими доходами и расходами, как следствие представляют больший риск для кредитора, а значит должны ожидать более высокой процентной ставки по кредиту, и, как следствие, премии к ключевой ставке процента.   Таким образом, мы ожидаем положительную взаимосвязь между данным показателем и зависимой переменной.

11)    Число лет с момента последнего нарушения 

Число лет с момента последнего нарушения кредитного договора в наблюдаемой выборке варьируется от 0 до 10 лет. Это достаточно высокий уровень для восьмидесятитысячной выборки. Однако следует отметить, что портал не раскрывает какие нарушения принимаются к учету. Возможно, речь идет о любом нарушении вплоть до задержки платежа на 1 сутки. Это может объяснить такой высокий уровень данного показателя. Другим объяснением этому может служить тот факт, что, в соответствии с собранными данными,  чаще всего средства запрашиваются на погашение имеющихся долгов, а значит, в какой-то момент времени заемщики понимают, что не могут или не хотят финансировать задолженность своими личными средствами, и, в случае, когда они этого сделать не могут по причине нехватки средств, нередко возникают нарушения кредитного соглашения.

Показатель числа лет с момента последнего нарушения кредитного соглашения также можно рассматривать как меру благонадежности заемщика аналогично «сроку давности» относительно споров, судебных разбирательств и прочего. То есть, чем больше прошло времени с момента последнего нарушения, тем дольше заемщик имеет положительную историю, тем более благонадежным он является, и, как следствие, тем ниже должна быть ставка по его кредиту, а значит, и премия к ключевой процентной ставке.  В регрессионном анализе данный критерий представлен переменной years_since_last_delinq. Ожидается наличие отрицательной (обратной) взаимосвязи между данной переменной и зависимой переменной.

12)    Коэффициент использования возобновляемых кредитов

Коэффициент использования возобновляемых кредитов рассчитывается как отношение суммы кредитных средств, которыми пользуется заемщик, и общей суммой предоставленных возобновляемых кредитных линий. В наблюдаемой выборке данный показатель не превышает 0,5. Чем выше данный показатель, тем активнее заемщик использует имеющиеся у него кредитные линии, тем выше уровень его обязательств, а значит, тем ниже уровень его благонадежность. То есть процентная ставка по новому кредиту, а значит, и премия к ключевой процентной ставке, у такого заемщика должна быть выше. Таким образом, можно ожидать наличие  положительной взаимосвязи между данным показателем и зависимой переменной.

 
5. Выбор модели

Собранные данные являются набором показателей социально-экономических переменных, полученных в относительно  неизменных условиях, то есть являются набором независимых выборочных данных, принадлежащих некой генеральной совокупности. Таким образом, можно заключить, что собранные данные представляют собой пространственную выборку (англ. cross-sectional data).

Для анализа пространственных выборок успешно применяется метод наименьших квадратов (OLS – ordinary least squares), при условии соблюдения предпосылок модели. Выполнение предпосылок необходимо для получения надежных оценок модели. Нарушение предпосылок ведет к смещению оценок коэффициентов модели, а значит, к ошибкам моделирования и прогнозирования. 

Существуют 2 наиболее распространенные проблемы (нарушения предпосылок), с которыми сталкиваются аналитики, работающие с пространственными выборками: мультиколлинеарность и гетероскедастичность.

Мультиколлинеарность – проблема, возникающая при нарушении предпосылки о независимости регрессоров друг от друга. Один из способов идентификации данной проблемы является построение матрицы парных корреляций. Общее правило таково, что если коэффициент корреляции по модулю выше 0,7, имеет место проблема мультиколлинеарности. Однако данное правило достаточно относительно, поскольку, в случае, когда прочие коэффициенты корреляции стремятся к нулю, корреляция порядка 0,4 (по модулю) может быть источником проблемы мультиколлинеарности. Более надежной проверки наличия или отсутствия данной проблемы является сопоставление выводов индивидуальных t-статистик и групповой F-статистики в построенной модели регрессии о значимости коэффициентов модели. О наличии проблемы мультиколлинеарности свидетельствует конфликт выводов двух этих тестов. Как правило, это проявляется в том, что F-статистика демонстрирует совокупную значимость коэффициентов регрессии, в то время как индивидуальные t-статистики подтверждают незначимость коэффициентов. Существует 2 наиболее популярных метода решения проблемы мультиколлинеарности: трансформация или исключение одной из переменных, вовлеченных в данную проблему. Оставлять нужно ту переменную, которая увеличивает качество модели. Самой частой трансформацией является объединение коррелированных переменных в один показатель (отношение, коэффициент и т.д.), если это теоретически обосновано. Кроме этого часто применяется логарифмическое преобразование, которое также актуально для нормализации данных.

В оцениваемой модели были обнаружены переменные, которые потенциально могут являться источником проблемы мультиколлинеарности: форма владения жильем, длина кредитной истории, занятость и цель получения кредита – поскольку, они достаточно сильно коррелированы с прочими переменными, но степень корреляции не достигает критических величин[1]. Таким образом, окончательный вывод можно  сделать, проанализировав результаты регрессионного анализа.

Гетероскедастичность – проблема, возникающая при нарушении предпосылки о постоянстве дисперсии остатков регрессии. Остатки регрессии – это разница между реально наблюдаемыми значениями зависимой переменной и ее расчетными значениями (на основании полученных коэффициентов).  Для диагностики состояния остатков регрессии необходимо построить графики остатков в зависимости от каждого регрессора. Можно заключить, что проблема гетероскедастичности отсутствует, если остатки распределены равномерно и независимо от величины значения регрессора. Отметим, что еще одной предпосылкой нормального функционирования модели является нулевое математическое ожидание значения остатков. Это также легко определяется графически. Если проблема гетероскедастичности имеет место быть, существуют 2 метода ее решения: использование скорректированных стандартных ошибок в расчете статистик и корректировки оригинальных коэффициентов модели, применение обобщенного метода наименьших квадратов (GLS – Generalized least squares).

 
6. Анализ полной модели регрессии

Для построения регрессии изначально были использованы 80 000 наблюдений и 15 переменных, из которых 8 – фиктивные переменные.

По результатам регрессионного анализа[2] модель продемонстрировала аномально высокую степень детерминации (≈98,82%). Однако также проявилась проблема, о которой говорилось ранее – выводы группового F-теста и индивидуальных t-тестов расходятся. С точки зрения теста на общую значимость коэффициентов гипотеза о равенстве коэффициентов регрессии нулю должна быть отвергнута (Р-значение F-статистики меньше 0,01), а с точки зрения индивидуальных тестов на значимость коэффициентов гипотеза о равенстве того или иного коэффициента нулю не может быть отвергнута более чем в половине случаев (Р-значение t-статистик  больше 0,1). Принимая во внимание данный факт и тот факт, что ранее была выявлена достаточная степень корреляции проблемных переменных с прочими переменными, можно со всей уверенностью диагностировать наличие проблемы мультиколлинеарности. Обнаруженные проблемные переменные никакой трансформации подвержены быть не могут, и, поэтому, должны быть исключены из модели.

 

7. Анализ сокращенной модели регрессии

Анализ сокращенной модели[3] показал, что проблема мультиколлинеарности была успешно решена. По результатам обоих тестов (F и t) высокую значимость (на 5%-ом уровне) демонстрируют все коэффициенты регрессии.

Также модель была проверена на наличие проблемы гетероскедастичности. Для этого были построены графики остатков относительно регрессоров модели[4]. График распределения ошибок соответствует графику распределения белого шума (ошибки распределены независимо от регрессоров, математическое ожидание ошибок – 0) и свидетельствует об отсутствии проблемы  гетероскедастичности.

В результате построения сокращенной модели регрессии мы получили 1 зависимую переменную и 6 регрессоров из 12  первоначальных параметров.

Общее уравнение регрессии выглядит следующим образом:

На основе полученных результатов можно заключить, что взаимосвязи, определенные моделью, совпадают с теми, что были установлены аналитически ранее.

  •   Заемщики, запрашивающие средства на 5 лет при прочих равных условиях должны ожидать премию на 0,000585 процентных пункта (0,0585%) выше, чем аналогичные заемщики, запрашивающие кредит на 3 года
  •   Изменение кредитного рейтинга заемщика на 1 пункт (например, переход от А1 к А2) при прочих равных условиях приводит к изменению (росту) премии на 0,0065376 процентных пункта (0,65376%)
  •   Увеличение числа запросов на получение кредита внутри одного полугодия на 1 при прочих равных условиях приводит к росту премии на 0,000158 процентных пункта (0,0158%)
  •   Увеличение числа лет с момента последнего нарушения кредитного договора при прочих равных условиях приводит к сокращению премии на 0,0000178 процентных пункта (0,00178%)
  •   Увеличение коэффициента использования кредитных линий при прочих равных условиях на 0,1 приводит к увеличению премии на 0,000035 процентных пункта (0,0035%)[5]
  •   Увеличение доли долга в доходе заемщика на 0,1 при прочих равных условиях приводит к увеличению премии на 0,00012 процентных пункта (0,012%)[6]

Самую высокую магнитуду имеют такие показатели как «кредитный рейтинг» и «доля долга в доходе». Самую малую магнитуду имеет такой показатель как «число лет после последнего нарушения».

Незначимыми оказались такие показатели как «занятость», «цель получения кредита», «форма владение жильем»  и «длина кредитной истории». Это можно объяснить тем, что, как отмечалось ранее, эти показатели в базе данных компании LendingClub слабо детализированы. Незначимость такого параметра как «цель кредита» и «форма владение жильем» может объясняться несколькими факторами. Во-первых, никто в 100% случаях не проверяет достоверность предоставляемой информации. Во-вторых, никто не отслеживает, куда заемщик по факту потратил деньги. Не существует системы отчетности. В-третьих, параметр «цель кредита» должен отражать сумму кредита, но в нашем случае сумма ограничена $35 000.

«Годовой доход заемщика» и «размер кредиты» были объединены в единый коэффициент – «отношение долга к годовому доходу заемщика».

По результатам регрессионного анализа модель продемонстрировала высокую степень детерминации (≈89,32%). Модель обладает хорошей прогнозной силой.

Модель корректно прогнозирует размер премии в 94% случаев. Это подтверждает тестирование модели на данных, которые были заведомо исключены из анализируемой выборки. На диаграмме №2 хорошо видны результаты теста, где изображены 3 графика:

Красный график (Yрасч.) – процентная ставка, которую нам посчитала модель, на основе полученного регрессионного уравнения.  Зеленый график (Yнабл.) – это процентная ставка, которая определялась Р2Р платформой и по который были выданы займы. Синий график (Ошибка) – ошибка прогноза, отклонение расчетных данных от реальных. На графике видно, что ошибка очень маленькая. Тот факт что первых 2 графика практически идентично повторяют друг друга говорит о том, что качество модели очень высокое. Небольшое отклонение синего графика (Ошибка) от нуля, количественно подтверждает высокую вероятность расчета процентной ставки с помощью полученной модели.

 

Диаграмма 2. Тестирование прогнозной силы модели

Источник данных: рассчитано автором.

 
8. Выводы

Чтобы сократить процентную ставку кредита заемщик должен получить наиболее высокий кредитный рейтинг,  иметь небольшой коэффициент отношения долга к годовому доходу, иметь минимальный коэффициент использования возобновляемых кредитов, не нарушать условия кредитного договора в течении последних 10 лет, иметь наименьшее количество запросов на получение кредита за последние пол года и запросить кредит сроком на 3 года.

 
9. Список литературы

  1. Bachmann, A., Becker, A., Buerckner, D., Hilker, M. Kock, M., Lehmann, M. and Tiburtius, P. “Online peer-to-peer lending - a literature review”, Journal of Internet Banking and Commerce, vol. 16, №2, 2011.
  2. Binjie Luo, Zhangxi Lin. A decision tree model for herd behavior and empirical evidence from the online P2P lending market. Inf Syst E-Bus Manage, 2013.
  3. Eric C. Chaffee, Geoffrey C Rapp. “Regulating Online Peer-to-Peer Lending in the Aftermath of Dodd-Frank: In Search of an Evolving Regulatory Regime for an Evolving Industry.” University of Toledo Legal Studies Research Paper No. 2012-04
  4. Freedman, S. and Jin, G. Z. “Do Social Networks Solve Information Problems for Peer-to-Peer Lending? Evidence from Prosper.com”, NET Institute Working Paper, Vol. 08-43, November 2008. 
  5. Frerichs, A., Schumann, M. Peer to Peer Banking - State of the Art. Gottingen, 2008
  6. Herzenstein, M., Andrews, R. L., Dholakia, U. M., Lyandres, E. (2008). The Democratization Of Personal Consumer Loans? Determinants Of Success In Online Peer-To-Peer Lending Communities. 2008.
  7. Hulme, M. K., Wright, C. “Internet Based Social Lending: Past, Present and Future”, Social Futures Observatory: London, October 2006.
  8. Iyer, R., Khwaja, A.I., Luttmer, E. F., Shue, K. “Screening peers softly: inferring the quality of small borrowers” NBER Working Paper No. 15242, August 2009. 
  9. Loureiro, Y.K., Gonzalez, L. “When can a photo increase credit? The impact of lender and borrower profiles on online peer-to-peer loans”, International Journal of Bank Marketing, 2014.
  10. Moenninghoff, S. C., Wieandt, A. “The Future of Peer-to-Peer Finance”, Zeitschriftfür Betriebswirtschaftliche Forschung, August/September 2013 -  pp. 466-487.
  11. Serrano-Cinca, C., Gutiérrez-Nieto, B., López-Palacios, L., “Determinants of Default in P2P Lending”, PLoS ONE, 2015.
  12. Slattery, P. “Square Pegs in a Round Hole: SEC Regulation of Online Peer-to-Peer Lending and CFPB Alternative”, Yale Journal on Regulation, vol. 30, 2013.
  13. Verstein, A. “The Misregulation of Person-to-Person Lending”,  UC Davis Law Review, Vol. 45, No. 2, 2011.
  14. Wen, X., Wu, X. “An Analysis of Factors to Influence Successful Borrowing Rate in P2P Network Lending-A  Case Study of the Paipai Lending”, Finance Forum, No. 3, 2014 – pp. 3-8.
  15. Yandiev M. The Theory Of Finance: A Novel Finance Model Being Formed On The Internet. Russian Review (Русскоеобозрение), №1, 2015. - http://rusreview.com/journal/vol-1-2015/31-the-theory-of-finance-a-novel-finance-model-being-formed-on-the-internet.html
  16. Yang, Y. Analysis and Assessment of Credit rating model in P2P lending, An instrument to solve information asymmetry between lenders and borrowers / Master of Science in Management Studies / 08.05.2015 – MIT Sloan School of Management
  17. Zeng, R. “Legal Regulations in P2P Financing in the US and Europe”, US-China Law Review, vol. 10: 229, 2013 – pp. 229-245.
  18. Zhang, Y., Yang, Z., Pan, H.  “Influencing Factors of Online P2P Lending Success Rate in China” the National Natural Science Foundation of China (No.61309029, 61273293) and Ministry of Education Humanities Social Sciences Research Project (No.11YJC880163), 2015.
  19.  Мальцев А.И. Моделирование кредитного риска при peer-to-peer кредитовании / Выпускная квалификационная работа / Пермь, 2014 г. -  53с.

 
10. Приложения

Приложение №1

Таблица 1. Матрица парных корреляций регрессоров

  term grade inq_
last_
6m
years_
since_
last_
delinq
revol_
util
debt_
to_
income
home_
own
home_
rent
credit_
history_
length
employ-
ment 
purpose_
car 
 purpose_
home
purpose_
debt_
consoli-
dation
purpose_
small_
business
purpose_
cnsumer_
credit
term 1                            
grade -0.05 1                          
inq_last_6m 0.01 0.22 1                        
years_since_last_delinq 0.00 -0.03 0.02 1                      
revol_util -0.10 0.18 -0.11 0.00 1                    
debt_to_income -0.04 0.13 -0.09 0.03 0.07 1                  
home_own 0.02 0.01 0.00 0.01 -0.04 0.04 1                
home_rent 0.10 0.01 -0.03 0.64 -0.03 -0.01 -0.02 1              
credit_history_length 0.03 0.00 -0.44 0.00 0.00 0.00 0.01 0.00 1            
employ-ment 0.53 -0.02 0.01 0.02 -0.04 0.00 -0.02 0.17 0.00 1          
purpose_car 0.00 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 -0.02 0.00 1        
purpose_home 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.03 0.00 -0.02 1      
purpose_debt_consoli-dation 0.01 -0.01 -0.01 0.00 0.00 0.00 0.00 0.00 0.01 0.00 -0.11 -0.32 1    
purpose_small_business 0.00 0.01 0.00 0.00 0.00 0.00 0.01 0.00 -0.30 0.00 -0.01 -0.02 -0.12 1  
purpose_cnsumer_credit 0.00 0.00 0.00 -0.01 0.00 0.00 0.00 0.00 -0.01 0.00 -0.05 -0.15 -0.57 -0.06 1

  

Приложение №2

Вывод итогов модели полной регрессии

Регрессионная статистика
Множественный R 0.994077865
R-квадрат 0.988190802
Нормированный R-квадрат 0.988188587
Стандартная ошибка 0.004563083
Наблюдения 80 000

Дисперсионный анализ

  df SS MS F F sig
Регрессия 15 139.36 9.29 446 203 0.00
Остаток 79 984 1.67 0.00    
Итого 79 999 141.03      

 

  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
const 0.052151 0.000123 423.784894 0.000000 0.051910 0.052392
term 0.000572 0.000042 13.698514 0.000000 0.000490 0.000654
grade 0.006537 0.000003 2145.478352 0.000000 0.006531 0.006543
inq_last_6m 0.000160 0.000016 9.968949 0.000000 0.000129 0.000192
years_since_last_delinq -0.000019 0.000009 -2.151359 0.031451 -0.000037 -0.000002
revol_util 0.000356 0.000074 4.818033 0.000001 0.000211 0.000500
debt_to_income 0.001212 0.000165 7.355325 0.000000 -0.001535 0.008891
home_own 0.000027 0.000058 0.469873 0.638447 -0.000086 0.000141
home_rent 0.000095 0.000035 2.669838 0.007590 0.000025 0.000164
credit_history_length 0.000002 0.000002 0.707263 0.479405 -0.000003 0.000006
employment -0.000027 0.000024 -1.123822 0.261092 -0.000075 0.000020
purpose_car -0.000270 0.000199 -1.356122 0.175064 -0.000660 0.000120
purpose_home 0.000118 0.000101 1.168020 0.242802 -0.000080 0.000316
purpose_debt_consolidation -0.000154 0.000079 -1.935994 0.052872 -0.000309 0.000002
purpose_small_business -0.000042 0.000186 -0.227046 0.820389 -0.000406 0.000322
purpose_cnsumer_credit -0.000064 0.000083 -0.767950 0.442519 -0.000226 0.000099

  

Приложение № 3

Вывод итогов модели сокращенной регрессии

Регрессионная статистика 
Множественный R 0.898540619
R-квадрат 0.893217349
Нормированный R-квадрат 0.89320934
Стандартная ошибка 0.00
Наблюдения 80 000

Дисперсионный анализ

  df SS MS F F sig
Регрессия 6 139,36 23,23 111 521 0,00
Остаток 79 993 16,66 0,00    
Итого 79 999 156,02      

 

  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
 const   0.052042  0.000082  636.1935  0.000000  0.051881  0.052202
 term  0.000585  0.000041  14.16905  0.000000  0.000504  0.000666
 grade  0.006538  0.000003  2155.373  0.000000  0.006532  0.006544
 inq_last_6m   0.000158  0.000016  9.839076  0.000000  0.000126  0.000189
 years_since_last_delinq   -0.000018  0.000009  -1.994834  0.046064  -0.000035  0.000000
 revol_util  0.000348  0.000074  4.730443  0.000002   0.000204  0.000492
 debt_to_income  0.001204  0.000165  7.317657  0.000000  -0.001526  0.002408

 

Приложение № 4

Графики остатков в зависимости от регрессоров

 

 

 

скачать dle 10.2 Авто Тюнинг кузова