29
Пн, апр

Как машинное обучение помогает страховщикам повысить прибыльность

mashine learning copy«Лучшая зона» для страховщиков при использовании машинного обучения заключается в получении более четкой картины поведения клиентов.

Для многих страховых компаний США, особенно мелких и средних, стандартным подходом к изменению ставок является оценка различных сценариев ставок и выбор того, который лучше всего соответствует бизнес-целям, принимая во внимание нормативные требования. Этот подход обычно не включает сложного представления о том, как клиент будет реагировать на различные сценарии.

Исторически сложилось так, что разработка этих моделей поведения клиентов требует значительных усилий для построения и поддержки. Таким образом, руководители страховых компаний полагаются на анализ опроса клиентов.

Машинное обучение может помочь страховщикам лучше понять поведение клиентов. Но прежде чем страховщики освоят эту технологию, им необходимо рассмотреть две основные проблемы: дисбаланс в бизнес-портфелях и долгосрочные цели.

Дисбаланс в бизнес-портфелях

Страховщики сделают многое, чтобы получить общее представление об адекватности ставок. В большинстве случаев при изменении компонента (компонентов) ставки команда ценообразования должна учитывать «несбалансированный» фактор, чтобы предлагаемая ставка соответствовала общей адекватности.

Традиционные подходы используют исторические данные для получения фактора дисбаланса. Проблема с этим подходом в том, что он не учитывает будущую форму бизнес-портфеля.

Основное предположение состоит в том, что любая предложенная ставка будет принята покупателем. Клиенты, которые могут отказаться, будут заменены новым бизнесом, который выглядит точно так же, как клиент, который только что ушел. Оба предположения вряд ли оправдаются.

Это приводит к тому, что фактическое изменение сильно отличается от желаемого изменения. Эта проблема возникает из-за того, что группа ценообразования рассматривает только допущения, касающиеся страховых убытков и затрат.

Как найти свою золотую середину

Чтобы лучше понять ожидаемое влияние изменения ставки, страховщик должен включить в анализ поведение клиента. Но что мы подразумеваем под поведением клиентов и как его можно эффективно и точно смоделировать с помощью методов машинного обучения? Как мы управляем долгосрочными и краткосрочными целями всего портфеля?

Проще говоря, поведение клиентов — это спрос клиентов на продукт страховщика. Спрос на страхование охватывает новые полисы (приобретение) и удержание (продление) существующих полисов. Приобретение часто далее разбивается на модели осведомленности, рассмотрения и покупки, тогда как удержание разбивается на модели уведомления о продлении и модели среднесрочной отмены.

Краткосрочные и долгосрочные цели

Хотя общее повышение ставки может помочь в достижении немедленных целей по прибыли в краткосрочной перспективе, как оно может повлиять на спрос и бизнес в долгосрочной перспективе? Предположим, вы рассматриваете четыре различных сценария ставок для предстоящей подачи налоговой отчетности. Принимая во внимание влияние потребительского спроса, вы можете отслеживать истинное влияние каждого сценария на прибыль в течение нескольких периодов по мере того, как портфель начинает меняться. Без этого понимания вы можете остаться в «ничейной зоне» при прогнозировании будущих результатов.

Исходные данные

Данные, используемые для построения этих моделей, могут быть весьма обширными и часто классифицируются следующим образом:

- Атрибуты и отношения: каков клиент?
- Окружающая среда: что такое внешние воздействия?
- Влияния: Что вы сделали с клиентом?
- Изменения статуса и триггеры: что изменилось и когда?

Модели спроса строятся либо на уровне портфеля, либо на уровне ключевого подсегмента, чтобы точно отражать поведение клиентов. Кроме того, в отличие от большинства моделей, спрос меняется гораздо быстрее, что требует более частых обновлений модели. Построение и обновление этих моделей требует значительной работы. Все это возможно с использованием традиционных инструментов моделирования, таких как обобщенная линейная модель (GLM). Но эти традиционные инструменты также требуют квалифицированных ресурсов для разработки и обслуживания. Именно здесь методы машинного обучения чрезвычайно полезны, поскольку они автоматизируют этот процесс.

Моделирование поведения клиентов

Традиционные инструменты моделирования, такие как GLM, часто называют параметрическими решениями. Это означает, что результирующий прогноз поведения может быть выражен в виде уравнения, аналогичного расчету стандартного порядка ставок. Эта форма полезна, потому что ее легче интерпретировать. Однако для создания и обслуживания этих решений может потребоваться больше времени.

Модели машинного обучения называются непараметрическими решениями. В этой форме прогнозируемое поведение выражается в виде дерева решений (или ряда деревьев решений).

Популярность этих методов возросла, потому что они, как правило, обладают большей прогностической силой, чем традиционные инструменты моделирования, и они более явно включают автоматизацию, поэтому их быстрее создавать и легче поддерживать.

Одной из наиболее распространенных ошибок, на которую следует обратить внимание, является переоснащение. Этот термин используется, когда модель хорошо описывает данные об опыте, но плохо предсказывает будущие результаты (т. е. модели с переоснащением «застревают в прошлом»). Вероятность переобучения чрезвычайно высока при использовании моделей машинного обучения. Это еще более усложняется, потому что при обновлении результатов модели обычно включают уровень автоматизации.

Поэтому A/B-тестирование рекомендуется проводить посредством выборки, которая устанавливает наборы данных для моделирования, проверки и тестирования. Затем данные моделирования сворачиваются для дальнейшего снижения риска переобучения.

Еще одна сложная ловушка модели машинного обучения — интерпретация. Мы можем посмотреть на дерево, но имейте в виду, что мы построили сложную серию рекурсивных деревьев. Таким образом, чрезвычайно сложно сформулировать, почему клиент может иметь более высокий или более низкий спрос на страховой продукт. Несколько стратегий для управления этим:

Вывод важности факторов. Это позволяет определить, какой фактор оказывает наибольшее влияние на модель. Следует соблюдать осторожность при интерпретации этого результата, потому что он говорит только о том, какой фактор важен. Не говорится, связано ли это значение с высоким или низким спросом. Собственный алгоритм, который определяет наиболее важные факторы и наиболее важные комбинации факторов, определенных алгоритмом машинного обучения, имеет решающее значение для лучшего понимания базовой структуры.

Графики частичной зависимости. Это позволяет интерпретатору объяснять сложные модели более простыми утверждениями. Это очень полезно, когда вы пытаетесь понять, что говорит модель, однако, по сути, это все еще приближение.

Используя эти методы интерпретации вместе с методами машинного обучения, компания может сформулировать, какие клиенты, вероятно, будут иметь более высокий спрос на их продукт (результаты машинного обучения) и почему инструмент машинного обучения идентифицировал этих клиентов (каковы ключевые факторы, ключевые профили и как модель может взвешивать различные факторы в профиле).

Гибкость на рынке

Поведение клиентов является важным предположением, которое имеет решающее значение для оценки влияния продукта и ценообразования. Как уже отмечалось, традиционные несбалансированные подходы могут привести к недостаточным ставкам, что приведет к будущему увеличению и может существенно повлиять на форму бизнес-портфеля. Однако, в отличие от моделей затрат и издержек, допущения в этих моделях спроса довольно быстро устаревают, поэтому они требуют дополнительного обслуживания.

Значение алгоритмов машинного обучения как важного инструмента для анализа поведения представляет собой шаг вперед по сравнению со стандартными методами моделирования. Они не только дают более точные прогнозы; они также могут быть настроены для облегчения обслуживания. Хотя это существенные преимущества, все еще есть о чем беспокоиться из-за природы таких инструментов как «черный ящик».

Преимущество моделей поведения клиентов приводит к более точной оценке влияния на тарифы, количественной оценке краткосрочной и долгосрочной ценности каждого клиента и созданию надежной основы для оценки существующих продуктов, а также выявления «искусства возможного» в будущих продуктах.

Страховщики могут столкнуться с трудностями при сборе данных о принятии новых коммерческих предложений, продлении и отмене полисов. Однако, используя машинное обучение, они получают более четкое представление о том, как клиенты — как существующие, так и новые — могут реагировать на изменения ставок. Это может обеспечить более глубокое понимание при определении изменений ставок и добиться большей прибыльности — большого успех для бизнеса страховщика.

Серхат Гювен — управляющий директор отдела страховых консультаций и технологий WTW.

Перевод с англ. подготовлен порталом Allinsurance.kz