что такое lgd в банке

Оценка LGD дефолтных и проблемных активов – Передовая практика

Введение

Оценка LGD необходима для разных целей, в том числе для соблюдения требований, внутреннего распределения капитала, ценообразования, стресс-тестирования и секьюритизации. Рассматривая отдельные активы, каждому активу в любой момент времени обычно присваивают ряд разных (хотя и анатилически согласованных) оценок LGD, включая ожидаемые LGD (для учета по МСФО 9), LGD при экономическом спаде (для распределения капитала согласно Базелю), стрессовые LGD и другие оценки для целей внутреннего пользования.

Большинство активов подавляющей части финансовых учреждений являются производительными. Следовательно, в центре внимания всех этих видов LGD (независимо от цели оценки) естественным образом оказывается оценка потерь в случае будущего дефолта (в настоящее время беспроблемного) актива.

Несмотря на это, проблемные активы и активы, уже ставшие дефолтными, вызывают особые дополнительные вопросы. В данной статье обсуждается передовая практика решения этих вопросов.

Общие соображения

Как только кредитная характеристика заемщика ухудшается настолько, что ему присваивают статус «проблемного», он традиционно и все чаще становится объектом повышенного внимания и проверки.

С этого момента оценки LGD (и вероятности дефолта (PD), в случае его отсутствия) обязательно надо пересматривать не только относительно остального портфеля для целей внешней отчетности (например, по МСФО9 и базельской) и в интересах регулярной внутренней управленческой отчетности, но и для повышения их частотности. В частности, присвоенные значения PD могут меняться (по мере перехода обязательств из категории просрочки от 1 до 30 дней в категорию просрочки от 60 до 90 дней), и оценки LGD нуждаются в обновлении вместе с ними. Аналогичным образом, по мере повышения доступности информации (о случаях более крупного масштаба), может понадобиться уточнение оценок LGD, даже если присвоенные значения PD остаются неизменными.

Крайне важно проводить актуализацию LGD (и PD, когда это целесообразно) с применением методологий, аналитически согласованных с теми, которые используют для непроблемных активов, а также с целью пересмотра оценки LGD (например, МСФО 9, Базеля, внутренней отчетности).

Аналитически согласованная методология оценки LGD

Надежная методология оценки LGD работает следующим образом:

При оценке LGD (и в дополнение к распределению вероятности EVA и LVA) учитывают также следующие факторы:

Проблемные, но не дефолтные

Пока заемщика классифицируют как «проблемного» (но не дефолтного), его продолжают считать «непрерывно действующим» (поскольку дефолта – пока еще – не ожидают), а для оценки LGD используют EVA (хотя EVA рассчитывают, исходя из финансовой характеристики актива как проблемного).

Дефолтные

Дефолты можно подразделить на:

С течением времени дефолты могут: мигрировать из одной подгруппы в другую; быть устранены до начала процедуры банкротства (благодаря спасительной поддержке или реструктуризации); быть устранены с появлением (реструктурированного) «непрерывно действующего» предприятия (обычно из ситуации дефолта выходят на этапе управления при банкротстве, а не на этапе ликвидации) или завершиться полной ликвидацией или роспуском (с последующими конечными потерями, уже известными и фактическими итоговыми).

Дефолтные, но не банкротные

Передовая практика оценки дефолтов с таким статусом включает, в первую очередь, оценку EVA (экономической стоимости активов) и LVA (ликвидационной стоимости активов) компании.

EVA определяют в порядке, предусмотренном для недефолтных заемщиков, которые являются «непрерывно действующими» (то есть, в общем и целом, как скорректированную стоимость балансовых активов плюс стоимость будущей коммерческой деятельности, которая будет осуществлена в качестве «непрерывно действующего» предприятия). LVA определяют, исходя из допущения о ликвидации (то есть неизбежного прекращения деятельности, как скорректированную стоимость балансовых активов).

С аналитической точки зрения, первый подход (EVA) целесообразен для дефолтных фирм, процедура банкротства в отношении которых еще не начата (или начата, но впоследствии безуспешно завершена), но которые либо реструктурируют свои обязательства, либо получают спасительную поддержку или приобретаются третьими сторонами (с экономическим убытком для кредиторов или без него). С аналитической точки зрения, второй подход (LVA) целесообразен для фирм, в отношении которых начата процедура банкротства или ликвидации (которые впоследствии ликвидированы или распущены).

Затем в обычном порядке запускают модель LGD для расчета будущих коэффициентов LGD для обоих описанных выше подходов (то есть разделяя первоначальные значения при помощи EVA и LVA).

Наконец, коэффициенты дефолта (без банкротства), переходящего в статус (a) выхода из дефолта и (b) банкротства, применяют как весовые коэффициенты к двум будущим показателям LGD для завершения расчета и получения результата.

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

Поскольку миграция обычно занимает короткий временной промежуток и коэффициенты миграции варьируются в зависимости от экономических условий, передовая практика заключается в использовании срезовых (PIT) коэффициентов миграции (отражающих текущие и будущие экономические условия), а не долгосрочных средних коэффициентов миграции.

В случаях, когда актуальная информация о проблемном финансовом профиле заемщика недоступна, традиционно применяют инструменты оценки значений EVA и LVA как функции от: последней доступной финансовой информации; соответствующих коэффициентов PD в отношении к такой финансовой информации; а также макроэкономических показателей, относящихся к периоду из финансовой отчетности.

Дефолтные и банкротные (но НЕ ликвидируемые или распускаемые)

Тот же средневзвешенный подход применим к дефолтным, но НЕ банкротным активам.

LGD3 = P4 x LGD1 + P5 x LGD2

Дефолтные и банкротные в процессе ликвидации или роспуска

LGD при дефолте этой подкатегории рассчитывают исключительно на основании ликвидационной стоимости активов (LVA).

Индивидуальные оценки LGD в противовес количественным оценкам LGD

Индивидуальный подход означает оценку LGD (или изменение LGD, полученного количественным методом) на основании конкретной информации, предоставленной о конкретном заемщике или активе.

В целом, индивидуальный подход относится к добросовестной практике управления рисками, если (i) сумма риска велика (и существенна для кредитора) и (ii) кредитор обладает определенной информацией о дефолтном заемщике и его текущем финансовом положении, что позволяет осуществить более точный расчет по конкретной фирме.

Количественные подходы более общего характера целесообразны с практической точки зрения, когда суммы риска невелики (поэтому стоимость точной индивидуальной оценки фирмы перевешивает выгоды от повышенной точности) или когда доступной информации недостаточно (на дату расчета) для использования индивидуального фирмоориентированного подхода (причем любая попытка индивидуального расчета по фирме даст ложные результаты). Более того, для крупных портфелей со средними рисками (таких как малые и средние предприятия или розница) обычно выбирают коллективный подход с применением количественных методов к дефолтным субпортфелям.

Также встречаются случаи, когда при оценке большого портфеля первоначально следуют количественному подходу по причине недостатка информации для индивидуального расчета, но впоследствии, в рамках более поздних периодов учета, переходят на индивидуальный подход (когда больший объем информации становится доступным).

Применение индивидуальных подходов все же не исключает использования количественных методов оценки LGD (пусть и играющих вспомогательную роль), так как:

Источник

Убыток при невыполнении обязательств (LGD)

Опубликовано 14.07.2021 · Обновлено 14.07.2021

Что такое Убыток при невыполнении обязательств (LGD)?

Убыток при невыполнении обязательств (LGD) – это сумма денег, которую банк или другое финансовое учреждение теряет, когда заемщик не выполняет свои обязательства по ссуде, и выражается в процентах от общей суммы риска на момент дефолта. Общий LGD финансового учреждения рассчитывается после проверки всех непогашенных кредитов с использованием совокупных убытков и рисков.

Ключевые моменты

Понимание убытков при неисполнении обязательств (LGD)

Хотя существует несколько способов расчета LGD, наиболее популярным среди многих аналитиков и бухгалтеров является расчет на валовой основе. Причина этого во многом заключается в его простой формуле, которая не учитывает стоимость обеспечения по кредиту. Этот расчет LGD сравнивает сумму потенциального или фактического убытка в долларах с общей суммой риска на момент, когда ссуда переходит в дефолт. Этот метод также является наиболее популярным, поскольку академические аналитики обычно имеют доступ только к данным рынка облигаций, а это означает, что стоимость обеспечения недоступна, неизвестна или не важна.

Краткая справка

Самым популярным методом определения LGD среди бухгалтеров и аналитиков является расчет на валовой основе, который не включает стоимость обеспечения по кредиту.

Пример убытка при невыполнении обязательств

Представьте, что заемщик берет ссуду на покупку квартиры в размере 400 000 долларов. После внесения платежей по кредиту в рассрочку на несколько лет заемщик сталкивается с финансовыми трудностями и дефолтом, если по ссуде имеется непогашенный остаток или риск дефолта в размере 300 000 долларов. Банк лишает права собственности на кондоминиум и может продать его за 240 000 долларов. Чистый убыток для банка составляет 60 000 долларов (300 000 – 240 000 долларов), а LGD составляет 20% (300 000 – 240 000 долларов) / 300 000 долларов).

В этом сценарии ожидаемые убытки будут рассчитываться по следующему уравнению: LGD (20%) X вероятность дефолта (100%) X риск дефолта (300 000 долларов США) = 60 000 долларов США. Если бы финансовое учреждение прогнозировало потенциальный, но не определенный убыток, ожидаемый убыток был бы другим. Используя те же цифры из приведенного выше сценария, но предполагая только 50% вероятность дефолта, уравнение для расчета ожидаемых убытков выглядит следующим образом: LGD (20%) X вероятность дефолта (50%) X риск дефолта (300 000 долларов США) = 30 000 долларов США.

Источник

ML и DS оттенки кредитного риск-менеджмента | Компоненты

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

В предыдущей статье цикла о моделировании в задачах управления кредитным риском (здесь) мы провели обзор трех задач кредитного риск-менеджмента, нашли возможные точки приложения ML и DS к этим задачам и попутно ввели набор терминов для дальнейшей работы.

Сейчас мы расскажем о трех компонентах (PD, LGD, EAD), которые участвуют при расчете ожидаемых потерь: рассмотрим основные драйверы и методологию построения моделей. В конце статьи приведем сводную таблицу с особенностями работы с компонентами на различных этапах разработки, сформированную на основе нашего проектного опыта.

За подробностями добро пожаловать под кат.

PD или как ковер задает стиль всей комнате

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

Определение дефолта

Начнем с главной компоненты, которую необходимо оценивать (например, в случае базового или продвинутого ПВР) PD (a. k. a. probability of default) – вероятность дефолта клиента. В качестве свидетельства о дефолте клиента могут выступать разные события в кредитной истории. Часто – это просрочка платежа по кредитному договору 90 и более дней.

Для подсчета количества дней просрочки существует два метода: LIFO (last in first out) и FIFO (first in first out) [1]:

Для определения дефолта необходимо задать следующие три атрибута:

Но этого недостаточно для формирования целевого события. У целевого события есть еще один важный атрибут: горизонт сбора информации о дефолте, или горизонт моделирования.

Определение длины горизонта

Информация о дефолте используется для оценки ожидаемых потерь, под которые банк осуществляет резервирование. В этом случае возникает вопрос, а на каком периоде смотреть выходы в дефолт? Важно ли это? С точки зрения бизнеса, важно понимать период планирования, с точки зрения моделей мы хотим выбрать такой период, в котором будет охвачено не менее 80%-90% всех возможных выходов в дефолт для всех открытых и не находящихся в дефолте договоров на текущий момент времени.

Для целей выбора длины горизонта может быть использован винтажный анализ [2]. Он заключается в построении графической аналитики и последующего вывода о данных по ней. График может быть построен так:

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

При построении графика выше для каждой когорты было рассчитано значение, составляющее 80% от максимального числа наблюдений, вышедших в дефолт, а диапазон полученных значений обозначен серой полосой. По графику можно сделать вывод о том, что оптимальная длина горизонта лежит в интервале 6-8 месяцев.

Сегментирование выборки

Некоторые атрибуты настолько сильно коррелируют с целевой переменной, что вклад остальных практически нивелируется. Это приводит к моделям с плохим ранжированием внутри группы с одинаковым значением «главного» атрибута. Во избежание такой ситуации используют подход сегментации, в рамках которого выборку делят на два или несколько сегментов — по одному на каждое значение «главного» атрибута (драйвера), и для каждого из них строят отдельную модель. В кредитном риске один из таких драйверов – наличие или длительность просрочки по платежу.

Если выборка была разделена на два сегмента по длительности просрочки: сегмент с малой просрочкой и сегмент с большой просрочкой, и второй сегмент достаточно мал, то для него можно сделать простую модель на двух атрибутах: на скоринговом балле модели с малой просрочкой и длительности текущей просрочки. Если результат удовлетворяет всем требованиям валидации, то на нем можно остановиться.

Альтернативно можно разделить выборки на сегменты с просрочками за историю (I) и без просрочек за историю (II).

Необходимое условие для сегментации – достаточное количество дефолтных наблюдений в каждом из сегментов. А для того, чтобы выяснить целесообразность и границы новых сегментов используется roll-rate анализ [3]. Он заключается в разделении выборки на подсегменты на основании значений величины текущей просрочки и сравнении между ними среднего уровня дефолта. Те группы, уровень дефолта которых значимо различается, имеет смысл моделировать по отдельности.

Рассмотрим, например, сегментацию наблюдений по величине просрочки. На картинке ниже в качестве примера выделены следующие 5 сегментов, соответствующих интервалам (бакетам) значений просрочки: 0-4 дня, 5-14 дней, 15-29 дней, 30-59 дней, 60-89 дней. Эти сегменты рассматриваются в нескольких моментах времени: HY1_2015, HY2_2015 — соответственно, первое и второе полугодия 2015 года, HY1_2016, HY2_2016 — соответственно, первое и второе полугодия 2016 года. В процессе анализа нас интересует динамика выхода наблюдений в просрочку более 89 дней, поэтому для каждого из этих сегментов подсчитан процент клиентов, просрочка которых на горизонте наблюдения составила более 89 дней.

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

По графику можно сделать следующие выводы:

EAD (Деньги в дефолте)

После того, как оценена вероятность дефолта заемщика, ставится вопрос – с какой суммой задолженности заемщик уйдет в дефолт? Эта сумма линейно влияет на размер ожидаемых потерь и, соответственно, объем резервов, и называется exposure at default – требования в дефолте. Итак, EAD – exposure at default – кредитные обязательства по договору на момент дефолта.

Напрямую, как правило, EAD не моделируют. Так как эта величина – денежная, её распределение не носит нормальный характер: в выборке могут присутствовать наблюдения очень большие и очень маленькие, не являющиеся при этом аномалиями. В зависимости от специфики портфеля можно выбрать разные целевые переменные – об этом подробнее будет сказано в последующих статьях цикла, но наиболее широко используемая – CCF – credit conversion factor – коэффициент кредитной конверсии – вычисляется следующим образом:

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

где:
Balance – сумма средств, которые клиент должен банку в момент наблюдения,
Limit – доступный клиенту лимит,
EAD – сумма средств, который клиент должен банку в момент дефолта.

Получается, что CCF – это та часть доступных на момент наблюдения средств, которая будет использована клиентом к моменту дефолта.

Как и вероятность дефолта, эту величину необходимо прогнозировать заранее. Обычно горизонт прогноза такой же, что и у PD.

Все описанное выше касалось денег до дефолта и во время него. А что происходит сразу после? Об этом компонента LGD.

LGD («Где деньги, Лебовски?»)

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

Даже в случае дефолта заемщика, часть средств возвращается в банк:

Поскольку временной интервал, на котором происходит т.н. «восстановление» (возвращение долга), может варьироваться поклиентно, возникает необходимость определить длину горизонта восстановления, на котором будет рассчитываться целевая переменная. На длину горизонта влияет в первую очередь доступность достаточного временного периода в данных для моделирования. Обычно длина горизонта лежит в диапазоне 3-5 лет после дефолта.

В общем случае LGD рассчитывается формуле:

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

где:
Ri – денежный поток от клиента (выплаты, реализация залога и др.), полученный на горизонте восстановления после дефолта,
T – временной период от момента учета возмещения после момента дефолта (в годах).

При расчете денежного потока, который идет на восстановление, обычно используется дисконтирование – механизм учета текущей стоимости денежных средств, полученных на горизонте восстановления. Особенно это актуально на больших горизонтах, когда стоимость денег может существенно изменяться.

Суммы возмещения, затрат и продажи долга при дисконтировании умножаются на «фактор дисконтирования» [4] P(T):

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

T – временной период от момента учета возмещения после момента дефолта (в годах),
r – ставка дисконтирования.

В качестве r может быть использована, например, процентная ставка по договору.

С компонентами, в первом приближении, понятно: все разные, а моделировать их нужно вместе! Есть ли какой-то подход, который позволит более-менее единообразно отобрать переменные для моделей и выбрать наиболее оптимальную комбинацию? Можно попробовать. О возможном варианте далее.

«Великолепный план, Уолтер … надёжный как … швейцарские часы» или pipeline разработки

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

Этапы моделирования компонент риска схематично изображены на следующей диаграмме (стрелки – дополнительные итерации, возникающие в процессе разработки):

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

Подготовка данных

Подготовка данных включает в себя формирование трёх сущностей: наблюдения (сегмент), витрина дефолтов, витрина атрибутов,- с единым внешним ключом — ID заемщика или договора и временная метка.

Такая декомпозиция обеспечивает гибкий подход к формированию выборки – легко изменять горизонт, гранулярность наблюдений, определение дефолта и не беспокоиться о корректности сбора атрибутов для итоговой витрины.

Каждое наблюдение – ID заемщика или договора и временная метка; другими словами, нас интересует состояние заемщика или договора на конкретную дату. Обычно используются наблюдения, соответствующие временным срезам, отстоящим друг от друга на равные промежутки времени (например, квартальным).

В случае задачи резервирования объем данных должен включать в себя полный экономический цикл, что составляет примерно 5-7 лет.

Для формирования выборки необходимо учитывать горизонт.

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

В выборки для разработки и тестирования включаются наблюдения, для которых есть данные о выходе в дефолт на всем горизонте, поскольку включение наблюдений, для которых не прошел полный этап сбора (на картинке изображен красным цветом) приведёт к смещению величины уровня дефолта.

Из-за необходимости учитывать период сбора, оптимальная глубина данных составляет 2-3 горизонта наблюдения.

Также, если в модели планируется учесть какого-то рода сезонность — необходимо соответствующим образом выбирать глубину данных и периодичность срезов.

В таблице под катом перечислены основные группы и примеры атрибутов широкого списка переменных.

Блок атрибутовЮЛ/ФЛОписаниеПримеры
ПрофильЮЛДанные, характеризующие компаниюОКОПФ, ОКВЭД (отрасль), возраст компании, число руководителей.
Количество полных лет/месяцев обслуживания в банке.
ФЛАнкета клиента, социодемографические данныеСемейное положение, пол, возраст, образование
Количество полных лет/месяцев обслуживания в банке
Государственные контрактыЮЛСводные данные по количеству и сумме государственных контрактов компанииКоличество/сумма гос. контрактов за период. Динамика данных показателей.
ФЛ
Арбитражные делаЮЛСводные данные по количеству и сумме арбитражных дел, в которых компания принимала участие.Количество/сумма арбитражных дел компании в качестве ответчика/истца/третьего лица за период. Динамика данных показателей.
ФЛСводные данные по количеству и сумме арбитражных дел, в которых клиент принимал участие.Количество/сумма арбитражных дел клиента в качестве ответчика/истца/третьего лица за период. Динамика данных показателей.
Транзакционные агрегатыЮЛСводные данные по количеству транзакций и оборотам для клиентаКоличество/сумма операций списания/начислений за период. Оборот компании за период. Динамика данных показателей.
ФЛСводные данные по количеству транзакций и оборотам для клиентаКоличество/сумма операций списания/начислений за период. Оборот собственных средств клиента за период. Динамика данных показателей.
Финансовые показателиЮЛДанные по финансовым показателям компанииВыручка, активы, общие обязательства EBITDA, OIBDA, Equity, оборачиваемость внеоборотных активов, оборачиваемость кредиторской задолженности и др. фин. показатели за период. Динамика данных показателей.
ФЛДанные по финансовым показателям клиентаPayment to income (PTI), debt to income (DTI)
КонтрагентыЮЛВзаимодействие с контрагентами, фигурантами списка клиентов с сомнительной репутациейФлаг наличия транзакций с фигурантами списка клиентов с сомнительной репутацией за период, число уникальных контрагентов за период
ФЛВзаимодействие с другими ФЛ, входящими в список клиентов с сомнительной репутациейФлаг наличия транзакций с фигурантами списка клиентов с сомнительной репутацией за период, число уникальных взаимодействий за период
Внешние данныеЮЛБКИАгрегированные показатели времени жизни договоров. Количество открытых договоров за период. Динамика открытия договоров. Агрегаты количества просрочек по контрактам за период в разрезе категорий просрочки.
ФЛБКИАгрегированные показатели времени жизни договоров. Количество открытых договоров за период. Динамика открытия договоров. Агрегаты количества просрочек по контрактам за период в разрезе категорий просрочки.
Негативная историяЮЛПопадание в список клиентов с сомнительной репутацией, срабатывание алгоритмов отслеживания мошеннических операций, результаты расследованийКоличество срабатываний алгоритмов отслеживания мошеннических операций за период, флаг попадания в список клиентов с сомнительной репутацией
ФЛПопадание в список клиентов с сомнительной репутацией, срабатывание алгоритмов отслеживания мошеннических операций, результаты расследованийКоличество срабатываний алгоритмов отслеживания мошеннических операций за период, флаг попадания в список клиентов с сомнительной репутацией
ГруппаЮЛДанные по компаниям, связанных с даннойВхождение в группу компаний с задолженностью/наличием арбитражных дел/присутствие компаний с высокорискованными ОКВЭДами
ФЛДанные по клиентам, связанных с даннымВхождение в группу клиентов с негативной информацией – просрочка, фрод.
Другие продуктыЮЛДанные по другим используемым продуктам банкаФлаг использования других продуктов, количество продуктов, оборот по продуктам. Динамика показателей.
ФЛДанные по другим используемым продуктам банкаФлаг использования других продуктов, количество продуктов, оборот по продуктам. Динамика показателей.

Один из способов увеличения интерпретируемости и стабильности модели – это использование в качестве атрибутов не абсолютных значений признаков, а относительных: нормированных, например, на доход (выручку) или отражающих тренд/динамику показателя на временном интервале.

Однофакторный анализ

Целью проведения однофакторного анализа является уточнение широкого списка факторов таким образом, чтобы исключить неподходящие переменные.

Для проведения однофакторного анализа необходимо разбить выборку на выборки для разработки (train) и тестирования (test). Выборка для тестирования может быть сформирована одним из следующих способов:

Стоит отметить, что в идеальном мире (где достаточное число клиентов и дефолтов) корректнее разбивать исходную выборку на три части (разработка, валидация и тестирование). В рамках такого разбиения проведение однофакторного анализа ведется на выборках для разработки и валидации, а итоговое качество отбора оценивается на выборке для тестирования. Для упрощения мы здесь и далее рассматриваем разбиение на train/test.

Многофакторный анализ и финальная модель

Цель многофакторного анализа – построение оптимальной комбинации факторов из списка, образованного на предыдущем шаге, для максимизации предсказательной силы модели при сохранении стабильности.

Процесс многофакторного анализа заключается в построении множества моделей и выборе наилучшей из них. Модели строятся на различных наборах атрибутов из списка, сформированного на этапе однофакторного анализа,

Две самые распространенные модели для прогноза вероятности дефолта – это:

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

где:
DistrGood – отношение числа недефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу недефолтных наблюдений;
DistrBad – отношение числа дефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу дефолтных наблюдений.

Общие правила для выполнения категоризации атрибутов складываются из экспертных правил (принципы заполнения пропусков, условие монотонности WOE, соответствие логике атрибута) и статистических критериев (достаточность наблюдений в категории).

Одним из недостатков подхода с использованием значений WOE вместо реальных значений атрибута являются потенциально возможные скачки значений вероятности дефолта (PD). Для решения указанной проблемы может использоваться сглаживание порогов функции WOE с целью создания непрерывных «плавных» переходов между соседними значениями WOE. Чаще всего сглаживание может производиться с помощью сигмоиды или гиперболического тангенса.

После описанных выше преобразований над атрибутами модель логистической регрессии строится над преобразованными атрибутами. Для выбора оптимальной комбинации факторов может быть использовано несколько подходов: [6]:

При построении модели в качестве оптимизируемой метрики могут быть использованы информационные критерии (например, SBC [8], AIC [9]). Разбиение атрибутов на группы и расчет значений WOE производится на выборке для разработки, а затем сформированный биннинг и соответствующие ему значения WOE транслируются в выборку для тестирования.

В случае, когда нет требования интерпретируемости, может быть использована модель градиентного бустинга, наиболее часто используется реализация библиотеки Xgboost. В данном случае отсутствует требование к слабой корреляции атрибутов модели. В случае необходимости ограничить набор признаков модели, используется значимость атрибута – его вклад в итоговое качество, оцениваемое коэффициентом Джини, дает не менее 1% или уменьшает функцию потерь на величину, превышающую пороговое значение.

Итоговое качество модели определяется на тестовой выборке. Выборка для тестирования может формироваться тем же способом, что и при проведении однофакторного анализа.

Сводная таблица по компонентам

PDLGDEAD
Целевое событиеВероятность дефолта (например, просрочка 90+) на горизонте заданной длиныЧасть долга, не возвращенная за период восстановления после дефолтаРазмер долга, который клиент будет должен на момент дефолта
Тип задачиБинарная классификацияРегрессияРегрессия
ГоризонтСрок, в течение которого клиент может попасть в дефолт (например, 1 год)Период восстановления после дефолта (3-5 лет)Срок, в течение которого клиент может попасть в дефолт (например, 1 год)
Глубина
данных (оптимальная/минимальная)
Экономический цикл (5-7 лет)/2-3 горизонта выхода в дефолтЭкономический цикл (5-7 лет) / 2-3 горизонта восстановления + 1 горизонт выхода в дефолт (для недефолтных договоров)Экономический цикл (5-7 лет)/2-3 горизонта выхода в дефолт
АлгоритмыИнтерпретируемые – логистическая регрессия, решающие деревья. Неинтерпретируемые – XGBoost, MLPGLM, логистическая регрессия, деревья решений, цепочно-лестничные методыGLM, логистическая регрессия
Основные драйверыВремя жизни договора, флаг наличия просрочек на некотором периоде, длительность текущей просрочки, оборот собственных средств, утилизация, обеспечение залогами, payment to income (PTI), debt to income (DTI), размер компании (для ЮЛ), отрасль (для ЮЛ)Количество дней в просрочке, возраст дефолта, наличие других кредитных договоров у данного клиента и его платежное поведение по
ним, обеспечение, размер компании
Количество дней в просрочке, размер утилизации на некотором периоде, время жизни договора, размер компании
Корректировка в рамках жизненного цикла моделиКалибровкаКалибровка/Downturn factorКалибровка/Downturn factor
Особенные требования к даннымИстория дефолтов, определение группы связанных лиц, список банкротствТребуются факты реализации залогов (чаще для ЮЛ), факты продажи и списания кредитовОпределение сегмента для моделирования («лимитных» продуктов), работа с траншами и корректное определение графика платежа по «лимитным» продуктам
Архитектура моделиОднокомпонентная – моделируется непосредственно PD в разрезе бизнес или аналитических сегментовОднокомпонентная [Recovery Rate(RR)/LGD], или двухкомпонентная –(вероятность выздоровления, уровень восстановления (RR)) для двух сегментов (договора в дефолте и не в дефолте)Однокомпонентная, но через вспомогательную переменную (например, CCF), двухкомпонентная – две вспомогательные компоненты
Основная метрика для количественной первичной валидацииДжини, биномиальный тест, тест Херфиндаля (распределение по рейтинговой шкале)Джини модифицированный, Loss-shortfall, зависимость поведения от возраста дефолта/длительности просрочкиДжини модифицированный

Выводы

Итак, в статье мы провели детализацию особенностей моделирования компонент ожидаемых потерь: PD, LGD и EAD.

Главный вывод можно сформулировать следующим образом: прежде чем мы дойдем до import xgboost as xgb ML необходимо существенную часть времени потратить на аналитику и учитывать особенности бизнес-процессов при разработке и тестировании модели. Формулу для DS, применительно к нашим компонентам, можно записать в следующем виде:

что такое lgd в банке. Смотреть фото что такое lgd в банке. Смотреть картинку что такое lgd в банке. Картинка про что такое lgd в банке. Фото что такое lgd в банке

Однако здесь стоит иметь ввиду два момента. Во-первых, для сегмента физических лиц характерна большая доля ML и автоматизации решений, по сравнению с сегментом юридических лиц. Во-вторых, доля ML вырастает за счет привлечения продвинутых алгоритмов для анализа, например текстовых и геоданных, а также для поиска сложных паттернов поведения клиентов по разнородным источникам.

Авторы статьи: Александр Бородин (abv_gbc), Алиса Пугачёва (alisaalisa),
Артём Савинов (artysav), Илья Могильников (eienkotowaru).

Список использованных терминов и сокращений

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *