ИСПОЛЬЗОВАНИЕ СРЕДСТВ DATA MINING ДЛЯ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ ЗАЁМЩИКА НА РЫНКЕ ПОТРЕБИТЕЛЬСКОГО КРЕДИТОВАНИЯ - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

ИСПОЛЬЗОВАНИЕ СРЕДСТВ DATA MINING ДЛЯ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ ЗАЁМЩИКА НА РЫНКЕ ПОТРЕБИТЕЛЬСКОГО КРЕДИТОВАНИЯ

Матвеев Е.А. 1, Лубягина А.О. 1
1НИУ-ВШЭ Пермь
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Кредитный рынок – это экономическое пространство, где организуются отношения, обусловленные движением свободных денег между заёмщиками и кредиторами на условиях возвратности и платности. Кредитному рынку России не много лет, поскольку он сформировался после развала Советского Союза, когда зародилась новая экономика страны, направленная на рынок. Структура банковской системы России развивается, с каждым годом появляются новые банки и новые услуги, в лучшую сторону меняются условия кредитования юридических и физических лиц. Однако проблем, таких как асимметрия информации, экономические кризисы, увеличивающееся число просроченных платежей, ещё очень много.

С подобными проблемами зачастую справляются методы оценки кредитоспособности заёмщика. Банки нуждаются в информации о кредитоспособности предприятий и физических лиц: их прибыльность во многом зависит от финансового состояния клиентов. Снижение риска при совершении ссудных операций возможно достичь на основе комплексного изучения кредитоспособности клиентов банка, что одновременно позволит организовать кредитование с учётом границ использования кредита. Изучение банками разнообразных факторов, которые могут повлечь за собой непогашение кредитов, или, напротив, обеспечивают их своевременный возврат, составляет содержание банковского анализа кредитоспособности. Таким образом, перед тем, как выдавать кредит, банки должны решить следующие вопросы: Способен ли заёмщик выполнить свои обязательства в срок? Готов ли он их исполнять?

Ответы на поставленные вопросы должен давать качественный анализ кредитоспособности клиентов банка. На сегодняшний день существуют методологии, предложенные различными авторами, созданные для удовлетворения цели определения кредитоспособности заёмщика. Например, метод, который основывается на расчёте четырёх показателей, отражающих кредитоспособность предприятий: коэффициента ликвидности, коэффициента соотношения собственных и заёмных средств и показателей оборачиваемости и рентабельности [5]. Существует также подход, основанный на использовании методов оценки кредитоспособности заёмщика других стран, в частности США и Англии [3]. Другой методологией является комплексная система оценки кредитоспособности заёмщика, разработанная в МГТУ им. Н.Э. Баумана [4].

Однако ни одна из этих и других методик не являются эффективными и имеют ограничения и неопределённости. Поэтому коммерческие банки применяют различные способы, не всегда решающие поставленную задачу.

Нами предложен новый метод оценки кредитоспособности заёмщика, который заключается в комплексном использовании средств DataMining. Это инструменты, реализованные в системе бизнес-аналитики DeductorStudioи обеспечивающие получение эффективного результата, например, замена данных, калькулятор и условие [2].

Постановка задачи об оценке кредитоспособности заёмщика

В данной статье рассматриваются кредитные отношения между коммерческими банками и обслуживаемыми ими физическими лицами. На рис. 1 представлена схема кредитных отношений в виде UML диаграммы вариантов использования. Кредитные отношения между банками и заёмщиками подразумеваютпредоставление ссуды и её возвратом с определённым процентом. В современном хозяйстве значительно расширяются границы кредитных отношений (кредита). Кредит обслуживает все большую долю товарных потоков, заменяя традиционные товарно-денежные отношения обмена. Кредит необходим как важное средство обеспечения финансово-хозяйственной деятельности экономических субъектов.

Рис. 1. Схема кредитных отношений

Границы кредита должны соблюдаться как банком, так и заёмщиком. Но это происходит не всегда, поэтому для улучшения функционирования кредитного механизма необходимо использовать экономические методы управления кредитом. Это позволит предотвратить неоправданные кредитные вложения, обеспечить своевременный и полный возврат ссуд, снизить риск неплатежа.

Сравнительный анализ и характеристика сопутствующих работ

В этом разделе изложена выжимка из научной литературы, краткая характеристика методов оценки кредитоспособности заёмщика, предложенных другими авторами.

Метод оценки финансового состояния заёмщика аспиранта Ульяновского государственного университета, Ульянова А.И. [5] основывается на расчёте ряда показателей, которые отражают кредитоспособность предприятий: коэффициента ликвидности, коэффициента соотношения собственных и заёмных средств и показателей оборачиваемости и рентабельности.

Однако данный подход применим только по отношению к предприятиям, а не к физическим лицам. Более того, для вышеперечисленных показателей существует ряд ограничений, которые значительно снижают эффективность использования данных коэффициентов в серьёзном финансовом анализе. Так, например, при расчёте показателей ликвидности происходит условное приведение к одному моменту времени (на отчётную дату) краткосрочных активов и пассивов. Если интерпретировать данный показатель в рамках наглядной ситуации хозяйственной деятельности, это будет означать, что в один момент предприятию необходимо перевести все свои активы в денежные средства для погашения кредиторской задолженности. Такая ситуация является скорее нестандартной для организации, чем типичной.

В работе Маковецкого М.Ю. [3] представлена характеристика существующих и имеющих практическое применение методов оценки кредитоспособности заёмщика таких, как:

  1. Американский вариант, основанный на «правиле пяти си» (character – репутация заёмщика, capacity – способность погасить ссуду, capital – владение активами, collateral – наличие обеспечения, conditions – экономическая конъюнктура и её перспективы).

  2. Использование ключевого слова «PARTS», в котором сосредоточены требования по выдаче ссуд заёмщикам (purpose – назначение, amount – сумма, repayment – возврат денег и процентов, term – срок, security – залог, обеспечение).

  3. «Z-счёт Альтмана» используется в практике зарубежных финансовых организаций и рассчитывается с помощью пяти показателей – доля чистого оборотного капитала в активах, отношение накоплений прибыли к активам, рентабельность активов, отношение стоимости всех обычных, привилегированных акций предприятия к заёмным средствам, оборачиваемость активов.

Вышеперечисленные способы оценки кредитоспособности заёмщика являются методиками качественного анализа. Такие модели основываются на агрегированных качественных характеристиках заёмщика и позволяют сопоставить множество факторов потенциального риска, но, в тоже время, при определении кредитоспособности превалирует субъективное мнение экспертов.

  1. Скоринговая модель может использоваться как для оценки уже предоставленного кредита (оценка степени вероятности нарушения фирмой условий кредитного договора), так и для отбора потенциальных заёмщиков. Скоринговая модель разрабатывается банками самостоятельно исходя из принципов и обычаев делового оборота, а так же банковского законодательства в конкретной стране. Для каждого показателя определяется несколько интервалов значений, каждому интервалу приписывается определенное количество балов и определяется «класс» заёмщика. Однако, определение оценивающих характеристик производится только на базе информации о тех клиентах, которым банк уже предоставил кредит.

  2. Рейтинговая методика – для оценки кредитного рейтинга заёмщика используются такие показатели, как прогнозируемый денежный поток, коэффициент прогноза банкротств, коэффициент покрытия общей задолженности, ликвидационная стоимость и др. К преимуществам такого метода можно отнести простоту и способность ранжирования заёмщиков по результатам анализа. Существенным недостатком рейтинговой методики является повсеместное использование одинаковых критических значений оценочных показателей для разных заёмщиков без учета специализации.

Таким образом, М.Ю. Маковецким было предложено изучать зарубежный опыт кредитования и использовать его в современной отечественной банковской практике. Однако, просто применить зарубежную модель оценки кредитоспособности заёмщика как шаблон и наставление к действиям, не удастся в силу ряда факторов, таких, как экономическое состояние, средний уровень достатка, показатели ВВП и ВНП в стране, менталитет граждан и др. Другими словами, процесс адаптации предложенных методик к российским реалиям сложен и требует ресурса времени.

Соколов Е.В. и соавторы [4] представили свой метод оценки кредитоспособности заёмщика, который выражен в виде схемы комплексной системы (рис. 2).

Рис. 2. Схема комплексной системы оценки кредитоспособности заёмщика

Суть метода заключается в сосредоточении усилий на анализе как сферы причин предприятия-заёмщика (системы руководства), так и сферы следствий, подтверждающего объективные возможности по возврату кредита. Предлагается исследовать сферу причин с использованием системы главных функций и алгоритма достижения цели. В соответствии с этим алгоритмом для достижения любой цели руководители на любом уровне должны последовательно реализовать главные функции руководства (информационная, планирования, технологическая, персонала, организационная, управления). В предлагаемой системе оценки кредитоспособности исследуется, начиная с высшего, несколько уровней руководства. Количество исследуемых уровней руководства увязывается с относительной величиной кредита.

Однако, такой подход не только уменьшает количество проблемных кредитов для банка и организации-заёмщика, но и увеличивает число отказов в кредите, что, как и большое количество просроченных кредитов, может привести предприятие к банкротству.

Необходимо заметить, что освещаемая в данной статье проблема рассматривалась начиная с 20-х годов в основном экономистами и банкирами. Оценка кредитоспособность заёмщика проводилась в подборе и расчёте тех или иных экономических показателей. И до сих пор не существует ни одной эффективной методики определения кредитоспособности клиента банка, основанной на использовании систем бизнес-аналитики и других информационных технологиях.

Таблица 1

Сравнительная характеристика методов оценки кредитоспособности заёмщика

п/п

Методы

Характеристики

Денежные затраты банка

Временные затраты банка

Обучаемость

Использование математического аппарата

Использование качественных показателей

Точность результатов

1

Расчёт показателей

На определение значения коэффициентов. Проведение интервью с заёмщиком

На проверку предоставленных заёмщиками данных. Проведение интервью с заёмщиком

Анализ данных автоматизируется. Эксперты обучаются только посредством приобретения реального опыта

Мат. Формула для получения точного результата

Приведение к одному моменту времени краткосрочных активов и пассивов приводит к снижению эффективности метода

2

«Правило пяти си»

На анализ критериев, получение информации о заёмщике из других банков

На определение их достоверности

Анализ данных автоматизируется. Эксперты обучаются только посредством приобретения реального опыта

5 показателей анализируемых экспертом

Достигается за счёт проведение интервью эксперта с заёмщиком, и анализе полученных данных

3

«PARTS»

На проведение интервью эксперта с заёмщиком и на анализ полученных данных экспертом

На проведение интервью и на глубокий анализ данных, полученных на интервью, экспертом

Очень сложно обучить нового эксперта в связи отсутствия эффективных методик обучения

5 показателей анализируемых экспертом

Основана на опыте и проницательности специалистов банка

4

«Z–счёт Альтмана»

На получение экспертом данных о заёмщиках и на проведение анализа.

На получение данных и их анализ

Обучить нового эксперта сложно, из-за того, что модель не подчиняется отраслевым особенностям российских условий

Использование формулы, в основе которой лежит комбинация 4–5 ключевых финансовых коэффициентов, характеризующих финансовое положение заёмщика

Подбор показателей и коэффициентов, на которые в формуле умножаются эти показатели и оценки результирующего значения

При определении кредитоспособности превалирует субъективное мнение экспертов

5

Скоринговая модель

На получение данных (с помощью анкет) и их анализ

На получение данных и их анализ

Анализ данных полностью автоматизирован

Использование комплекса показателей

Использование комплекса показателей

Основана на комплексном анализе данных по строго определённым формулам

6

Рейтинговая система

На получение финансовых характеристик заёмщика

На получение финансовых характеристик заёмщика и расчёт его рейтинга

Анализ данных частично автоматизируется остальные данные анализирует эксперт

Количественные факторы являются определяющими

Приведение заёмщиков (ранжирование) к единому показателю

Определяется лимитом кредитования потенциального заёмщика

7

Схема комплексной системы

Получение и анализ денежных потоков и остальных данных потенциального заёмщика

Анализ денежных потоков и остальных данных потенциального заёмщика экспертом

Данные анализируются только опытными экспертами

Особое внимание уделяется анализу денежных потоков

Анализируется большое количество разнообразных данных не связанных с финансовой составляющей

Увеличивает число отказов в кредите, что, может привести предприятие к банкротству

Ввиду того, что все вышеописанные методы имеют свои ограничения и недостатки и не являются достаточно эффективными, нами предлагается новый метод оценки кредитоспособности заёмщика, который заключается в комплексном использовании средств DataMining, подробно метод описан в следующей главе.

Описание метода оценки кредитоспособности заёмщика с использованием средств Data Mining

Целью данного исследования является разработка нового метода проведения анализа личных данных заёмщиков банков рынка потребительского кредитования для определения их кредитоспособности.

Суть метода заключается в комплексном использовании средств DataMining. В нашем работе использовались методы анализа системы бизнес-аналитики DeductorStudio: замена данных (замена значений по таблице подстановки, которая содержит пары, состоящие из исходного значения и выходного значения), калькулятор (возможность задавать формулы для полей, назначение у которых является выходным, а так же добавлять новые поля), фильтрация (указывается условие, по которому нужно выполнить отбор для данного поля).

Для реализации предложенного метода использовалась таблица с клиентской базой банка. Состав и содержание данных таблицы вытекают из понятия кредитоспособности, т.е. они должны отразить финансово-хозяйственное состояние физических лиц с точки зрения эффективности размещения и использования заёмных средств и всех средств вообще, оценить способность и готовность заёмщика совершать платежи и погашать кредиты в заранее определённые сроки. Важную роль в определении кредитоспособности физического лица играет не столько его способность возвратить долг, сколько готовность возвращать кредит и уплачивать проценты вовремя. Готовность эта у всех различна и зависит она от личных особенностей каждого человека. Этими особенностями могут быть образование, социальный класс, семейное положение, стаж работы и т. д.

Таблица с клиентской базой банка содержит в себе следующие данные:

  1. Дата – дата поступления данных о клиенте для последующего анализа кредитоспособности.

  2. Фамилия заёмщика.

  3. Имя заёмщика.

  4. Отчество заёмщика.

  5. Сумма кредита – размер желаемой ссуды.

  6. Размер ежемесячного платежа.

  7. Количество лет проживания в регионе.

  8. Социальный статус

  9. Социальный статус супруга (наличие постоянной работы).

  10. Образование – высшее/среднее/неоконченное высшее.

  11. Стаж работы – количество лет работы.

  12. Личный доход в месяц после налогообложения (для пенсионеров – размер пенсии).

  13. Рыночная стоимость автомобиля.

  14. Рыночная стоимость недвижимости.

  15. Наличие положительной кредитной истории – своевременные выплаты долга с процентами.

  16. Заключение из нарко- и психодиспансера.

  17. Наличие судимости.

  18. Размер отягощения алиментными обязанностями.

  19. Количество детей.

  20. Наличие освобождения от воинской обязанности.

Применение средств Data Mining

На этом этапе работы активно используется средство прогнозного моделирования и извлечения знаний DeductorStudio, которое включает в себя алгоритмы решения задач DataMining: ассоциация, кластеризация, классификация и регрессия. Применяются также алгоритмы машинного обучения и математической статистики, неоднократно показавшие свою эффективность при решении практических задач в системах бизнес-аналитики: нейронные сети, деревья решений, логистическая регрессия и др. В предложенном нами методе используются некоторые из этих функций:

  1. «замена данных», которая необходима для вычисления оценки кредитоспособности заёмщика, к числовому формату (например, значение «высшее» в поле «образование» заменить на значение 3, а «среднее» на 2);

  2. «калькулятор», необходимый для определения с помощью математического аппарата оценки кредитоспособности заёмщика;

  3. «фильтрация», позволяет оставлять в наборе данных только ту информацию, которая удовлетворяет заданным условиям.

Подробное описание каждого из вышеперечисленных действий представлено ниже.

Замена данных

Для использования функции «замена данных», необходимой для реализации предложенного метода, необходимо создать таблицу подстановки. По таблице подстановки производится замена значений, она содержит пары, состоящие из исходного значения и выходного значения. Например, 3 – «высшее образование», 2 – «среднее образование». Для получения точного достоверного результата работы метода необходимо воспользоваться таблицей подстановки (табл. 2).

Таблица 2

Таблица подстановки для клиентской базы банка

Поле таблицы

Старое значение

Новое значение

Социальный статус супруга

не работает

0

работает

1

Образование

начальное

1

среднее

2

среднее специальное(техническое)

3

высшее

4

несколько высших

5

Наличие положительной кредитной истории

нет

0

да

1

Заключение из нарко- и психодиспансера

выявлены отклонения/стоит на учёте

0

отклонений не выявлено/ на учёте не стоит

1

Наличие судимости

ранее судим

0

не судим

1

Наличие освобождения от воинской обязанности

нет

1

есть

2

Для каждого значения исходного набора данных ищется соответствие среди исходных значений таблицы подстановки. Если соответствие найдено, то значение меняется на соответствующее выходное значение из таблицы подстановки. Если значение не найдено в таблице, оно может быть либо заменено значением, указанным для замены «по умолчанию», либо оставлено без изменений (если такое значение не указано). Кроме того, можно указать значения, которые нужно вставить вместо пустых ячеек [2].

Вычисление оценки кредитоспособности

Расчёт оценки кредитоспособности состоит из двух частей:

  1. расчёт коэффициента связанного с денежными показателями – CI (Cash indicators);

  2. расчёт коэффициента не связанного с денежными показателями – QI (Qualitative indicators).

Оценка кредитоспособности находится путём сложения этих двух коэффициентов. Первый коэффициент (CI) считается по формуле:

,

где TR – личный доход в месяц после налогообложения (для пенсионеров – размер пенсии), MF (Monthly fee) – размер ежемесячного платежа. AP (Alimony payment) – размер отягощения алиментными обязательствами, PV (Property value) – рыночная стоимость недвижимости, CV (Car value) – рыночная стоимость автомобиля, DS (Duty of Service) – наличие освобождения от воинской обязанности, LA (Loan amount) – сумма кредита.

Второй коэффициент QI считается по формуле:

,

где: RT (Resident time) – количество лет проживания в регионе, EH (Employment history) – стаж работы, EL (Education level) – образование, PS (Partner status) – социальный статус супруга (и), CH (Credit history) – наличие положительной кредитной истории, CN (Children number) – количество детей, RC (Record of convictions) – наличие судимости, MN (Medical note) – заключение из нарко- и психодиспансера.

Определение выходных данных – категории заёмщика

Заключительным этапом анализа кредитоспособности заёмщиков, является отнесение их к определённым категориям заёмщика. В описываемом методе для определения категории заёмщика по вычисленной оценке его кредитоспособности используется такой инструмент DeductorStudio, как «Фильтрация». Данный инструмент позволят оставлять в наборе данных только те данные, которые удовлетворяют заданным условиям. Структура условия достаточно проста: поле, по значению которого будет производиться фильтрация; собственно условие (знак сравнения и значения с которым сравнивать); логическая операция (логическое «И» или «ИЛИ») в случае сложных условий.

Для определения категории заёмщика, необходимо разбить его оценку кредитоспособности на интервалы (группы) с помощью инструмента «Фильтрация». В предложенном нами методе используется три категории в силу удобства использования такой классификации, т.е. некоторые потенциальные заёмщики будут отнесены к категории «неудовлетворительны», некоторые к «удовлетворительны», а остальные к «рискованным». Нами предложена следующая шкала определение категории кредитоспособности потенциальных клиентов:

  1. Если оценка кредитоспособности больше чем 2,5, то такие заёмщики будут называться «Клиент банка» – физическое лицо, обладающее кредитоспособностью, удовлетворительной для банка.

  2. Если оценка кредитоспособности больше 1, но меньше 2,5, то такие заёмщики будут называться «Сомнительный клиент банка» – физическое лицо, обладающее кредитоспособностью, частично удовлетворительной для банка. В данном случае банк может выдать кредит с риском его возврата.

  3. Если оценка кредитоспособности меньше чем 1, то такие заёмщики будут называться «Не клиент банка» – результаты исследования настоятельно рекомендуют не выдавать кредит такому физическому лицу.

Предложенная шкала является гибкой. Так, если банк не желает рисковать, выдавая потребительские кредиты, то он может повышать коэффициент изменения категории кредитоспособности заёмщика на более высокий уровень. В другом случает, если банк нацелен на повышение количества выданных кредитов, – на низкий уровень.

Заключение

В заключение мы хотели бы подвести итоги и обозначить основные аспекты метода проведения исследования.

Во-первых, мы проанализировали предметную область, т.е. рассмотрели взаимодействие банка с потенциальными заёмщиками, то какие данные банки требуют и анализируют для принятия решения о платёжеспособности клиента.

Во-вторых, мы рассмотрели существующие методы оценки кредитоспособности клиентов, использующиеся на практике, и проанализировали их преимущества и недостатки по некоторым критериям. Различные методики оценки кредитоспособности отличаются друг от друга числом показателей, применяемых в качестве составных частей общего рейтинга заёмщика, а также различными подходами к самим характеристикам и приоритетностью каждой из них. В данной статье представлен также новый метод оценивания кредитоспособности клиента, включающий три этапа: подготовка (замена) данных; вычисление оценки кредитоспособности; определение категории платёжеспособности клиента.

Предложенный нами метод определения кредитоспособности клиента банка основан на использовании системы бизнес-аналитики и интегрированного использования средств DataMining. Предложенный нами метод является не только эффективным, но и гибким, поскольку его можно легко настроить на конкретные условия, требования, предъявляемые к клиентам банка, для получения необходимого результата.

Список литературы
  1. Банкосайт.ру: [Электронный ресурс] URL: http://perm.bankosite.ru/banks/index.html (Дата обращения: 06.01.13).

  2. Лебедев В.В. Информационные технологии бизнес-аналитики. Система подготовки принятия решения Deductor: Учебно-методическое пособие. НИУ ВШЭ – Пермь, 2011. 188 с.

  3. Маковецкий М.Ю. Методы оценки кредитоспособности заёмщика // Известия ПГПУ. №7 (11). 2008. С. 58–60.

  4. Соколов Е.В., Анголенко Н.И. Комплексная система оценки кредитоспособности заёмщика // Российское предпринимательство. № 2 (14). 2001. С. 69–78.

  5. Ульянов А.И. Эффективность методики определения кредитоспособности заемщика // Российское предпринимательство. № 8, Вып. 1 (95). 2007. С. 78–82.

 

Просмотров работы: 4568