Прогнозная аналитика в области страхования
14 августа
Статьи

Перспективы больших данных

Даже страховая отрасль, это великая пожилая дама анализа данных, была ошеломлена количеством данных, которые затопляют в настоящее время область цифровых данных. Там, где когда-то было трудно было собрать данные о потенциальных рисках, сегодняшние страховщики испытывают затруднения с их избытком.

Как отметил Мэтт Йозефович на форуме лидеров страхования, традиционный процесс оценки платежеспособности заемщика "был разработан для скудного информационного мира и пытается теперь приспособиться к его избыточности".

В любой день специалистам по анализу и обработке страховых данных доступна информация из:

  • Интегрированные информационные устройств
  • Смартфонов
  • Социальных медиа
  • Видеозаписей камер наблюдения
  • Списков избирателей
  • Кредитных отчетов
  • Аналитики веб-сайтов
  • Государственной статистики
  • Спутниковых данных

Более того, появление облачной вычислительной среды предоставляет компаниям относительно легкий способ для их агрегирования и хранения.

Эти источники сообщают страховщикам гораздо больше, чем данные прошлых периодов систем ведения договоров страхования, приложения управления клиентской информацией, биллинговые системы, а также отчеты за прошедший год. Благодаря продуманному анализу больших объемов данных, страховщики получили теперь возможность повысить точность ценообразования, создавать индивидуальные продукты и услуги, укреплять отношения с клиентами и способствовать более эффективному предотвращению убыточности.

Это хорошая новость для начинающих специалистов по обработке и анализу данных в области страхования. Поскольку большие данные продолжают свой рост, страховщики будут нуждаться в помощи при принятии решения об их использовании в своих интересах.

Персонализированная котировка риска

Когда-то страховые агенты были сродни местным врачам - они знали людей и местные сообщества как свои пять пальцев. Это означает, что они были осведомлены о рисках при продаже полисов завсегдатаям баров.

Чтобы соответствовать этому уровню знаний в эпоху децентрализации и Интернета, страховая отрасль обращается к большим данным. Совместный доклад Картографического управления и Королевского института страхования, Прилив больших данных: Как анализ данных может извлечь скрытое в них золото, выяснилось, что 9 из 10 респондентов считают, что доступ к данным в режиме реального времени может помочь им точнее спрогнозировать ценовой риск.

Специалисты по обработке и анализу данных в страховании теперь сочетают аналитические приложения, например, модели поведения на основе данных профиля клиента, с непрерывным потоком данных в реальном времени, например, спутниковые данные, метеорологические отчеты, датчики транспортных средств, чтобы получить подробные и персонализированные оценки риска.

Это влияет на итоговую прибыль компании. Как отмечает Сара Адамс :

"Премии могут лучше коррелироваться с рисками, что особенно актуально в связи с предстоящим прибытием Ее Величества Платежеспособности II. Если более точно рассчитывать капитал, основанный на риске, то это повлияет на минимальный объем капитала, который следует сохранять".

Более того, отмечает Йозефович, "есть больше возможностей выбирать риски, которые вы хотите, и тратить меньше времени на то, чтобы выбрасывать риски, которые вы не хотите".

Автострахование

Представьте себе мир, в котором беспроводные устройства «телематики» передают данные вождения в реальном времени в страховую компанию. А теперь представьте группу автостраховщиков, пускающих слюни на столы.

Страховые продукты на основе телематики существуют примерно с 1998 года, когда их впервые запустила Progressive. Но за прошедшие годы технология прошла долгий путь. В настоящее время в устройствах телематики используются встроенные навигационные системы (например, OnStar GM), встроенная диагностика (например, снимок прогрессивного снимка) и смартфоны.

Они могут быть использованы для создания персонализированных планов. В брошюре SAS, Телематика: Как большие данные преобразуют отрасль автострахования, авторы выделяют два из этих вариантов:

  1. PAYD: Автострахование на основании расстояния и частоты использования
  2. PHYD: Автострахование на основании расстояния и частоты использования, а также стиля вождения

PAYD довольно проста. Ее стоимость основана на количестве миль или километров, наезженных клиентом. Hollard Insurance, страховая компания из Южной Африки, используют шесть вариантов для пробега.

Но PAYD не учитывает привычки вождения. PHYD планирует использовать телематику для наблюдения за самыми разными факторами: скоростью, ускорением, поворотом, торможением, изменением полосы движения, расходом топлива, а также географическим местоположением, датой и временем. Если происходит авария, страховая компания имеет возможность воссоздать ситуацию.

Автостраховщики могут затем дать клиентам баллы UBI, высказать свое мнение по улучшению вождения и предоставить индивидуальную цену. К 2020 году Progressive прогнозирует, что свыше 25 процентов доходов от автострахования в США будут генерироваться посредством телематики.

Страхование имущества

При переезде на другое место жительство, как и в случаях с автострахованием, компании по страхованию имущества оценивают возможное использование телематики для создания умного страхования жилья. Эти источники данных могут включать в себя:

  • Датчики влажности, обнаруживающие наводнение или утечки
  • Умные бытовые приборы
  • Камеры безопасности
  • Другие источники

Объедините это с информацией из внешних источников (например, отчетов о местных преступлениях и трафиком), и вы можете прийти к комплексной всесторонней оценке риска претензий имущественных прав одного человека.

Если пойти еще дальше, то эти источники могут быть использованы для защиты клиента. Например, при прогнозной аналитике страховщики могут рассчитать вероятность события, такого как кража или ураган, и предпринять шаги во избежании страданий и боли и, конечно же, больших претензий.

Страхование жизни и здоровья

Мы живем в мире под контролем. Компании, занимающиеся страхованием жизни и здоровья, знают это лучше всех. Теперь в распоряжении страховщиков есть огромное количество разнообразной информации, чтобы создать профиль клиента и разработать индивидуальные коэффициенты "самочувствия". Так, они могут собирать:

  • Данные по транзакциям. Например, где и какую (нездоровую еду?) покупает клиент.
  • Информацию с датчиков, установленных на теле – т.е. с устройств, мониторящих различные параметры и оповещающих владельца о первых признаках болезни
  • Информацию с внешних мониторов – например, данные со спортивных тренажеров
  • Информацию из социальных сетей – например, твиты о состоянии здоровья или психики

Так, например, Humana, использует данные по требованиям возмещения убытков, чтобы определить, у каких клиентов максимальный риск оказаться в больнице с жалобами на предотвратимые болезни (и, соответственно, с предотвратимыми требованиями). Это дает им возможность вмешаться, прежде чем произойдет событие.

Полный профиль клиента

Как и любая другая отрасль, страхование стремится повысить показатели удовлетворенности клиентов, и в ее распоряжении для этой цели есть большие данные. Чем больше страховая знает об особенностях своих клиентов, как гласит теория, тем легче сделать их счастливыми, и получить премии.

Компании объединяют всю имеющуюся непосредственную информацию о клиенте, например, адрес электронной почты, звонки из колл-центра, отчеты оценщика и т.д., с данными из косвенных источников, например, из социальных сетей, комментариев к блогам, историю посещений веб-сайтов и историю кликов, для того, чтобы полный профиль каждого человека.

В компании Metlife это называют «The Wall»:

  • В сотрудничестве с MongoDB, Metlife разработала приложение по обслуживанию клиентов, которое предоставляет сотрудникам комплексную информацию по каждому клиенту.
  • "Стена" использует данные из более 70 систем и включает профильную информацию, такую как данные полиса и транзакции в рамках бизнес-деятельности.

Обладая полными профилями клиентов, страховые компании используют новые средства для оттачивания процедуры продажи, маркетинга и обслуживания текущих клиентов.

Оптимизация колл-центров

Колл-центр - это просто кипящий котел с данными. Для специалистов по данным в области страхования, это, также, бесценные возможности. Эти специалисты исследуют пути, как:

  • Комбинировать данные по требованиям о возмещении с телеком-записями CDR для анализа работы колл-центра и усовершенствования инструкций по работе со звонками.
  • Анализировать необработанные телекоммуникационные данные, моделировать временные шаблоны звонков и разрабатывать планы для оптимизации персонала.
  • Использовать анализ настроений – например, анализировать речь во время телефонной связи с колл-центрами или заниматься обработкой естественного языка (NLP) и текстовой аналитикой в соцсетях, чтобы улучшить качество обслуживания клиентов.

Сотрудники колл-центра также находятся в идеальной ситуации, чтобы продавать клиентам дополнительные продукты. Одно из применений полного профиля - дать этому участливому голосу на той стороне трубки возможность предложить вам наиболее актуальные продукты для удовлетворения ваших конкретных потребностей.

Обнаружение мошенничества

Мошенничество обходится страховой отрасли в миллионы, если не в миллиарды долларов каждый год. Для борьбы с ним страховые компании упорядочивают источники своих данных и вырабатывают многоканальные подходы с целью обнаружения мошенничества. Они внимательно анализируют как традиционные структурированные данные (например, требования о возмещении и данные полиса), так и текстовые данные (например, примечания оценщика, отчеты полиции и информация из соцсетей).

Используя при этом...

  • Текстовую аналитику
  • Прогнозную аналитику
  • Поведенческую аналитику
  • Техники анализа шаблонов, графов и связей между данными

... а также целый ряд прочих удобных инструментов, к которым прибегают специалисты по данным, когда получают подозрительные требования.

В тематической статье от 2012, Использование анализа большой данных в страховой отрасли, резюмируются преимущества активного подхода:

«Эти мероприятия могут помочь создать новые модели для определения шаблонов как стандартного, так и подозрительного поведения, которые могут использоваться для борьбы со все более изощренными случаями мошенничества в страховании.»

Риски и правила работы с данными

Задачи, с которыми предстоит столкнуться

Прежде чем стать компаниями, полностью ориентированными на данные, страховым компаниям предстоит преодолеть еще ряд препятствий. Некоторые из них уже очевидны. Например:

  • Отсутствие полноценных данных по транзакциям (например, оплаты по кредитным картам)
  • Низкая согласованность данных, результат "бункерного" хранения и управления данными
  • Отсутствие свободных средств для инвестиций в IT

Средние и небольшие страховые компании, в частности, считают включение анализа больших данных в свои финансовые стратегии и стратегии управления рисками слишком дорогим удовольствием.

Небольшие компании сталкиваются с еще одной проблемой. Им не хватает той клиентской базы, которая есть у акул этого бизнеса. Это дает им более ограниченное представление как о своих клиентах, так и рынке в целом.

Устаревшая инфраструктура

У крупных компаний свои заботы. Сейчас многим из них приходится бороться с изношенной IT-инфраструктурой, которая не приспособлена для обработки тех объемов и скоростей разнообразных данных, поступающих в них. Их реляционные базы данных скрежещут от нагрузок

В качестве решения некоторые компании отдают задачи по хранению и анализу данных (например, из соцсетей) на аутсорсинг. К сожалению, это не оставляет им возможности в полной мере воспользоваться своими данными. Как мы уже видели в разделе "Перспективы", чем больше дополнительных источников данных используется, тем более точным будет анализ.

Недостаток квалификации

Это, конечно, предполагает, что у вас в штате есть специалисты по данным. Большие данные могут использоваться для решения множества проблем, но только в том случае, если у вас есть сотрудники, которые знают, как задавать правильные вопросы.

А у многих страховых компаний их нет. В исследовании Ordnance, на которое мы уже ссылались, говорится, что:

  • 95% респондентов согласились с тем, у многих отделов андеррайтинга не хватает необходимых для работы инструментов
  • 81% согласились с тем, что во многих отделах андеррайтинга не хватает компетентных специалистов

С этой проблемой можно справиться. Страховая индустрия изобилует статистическими навыками. Это всего лишь вопрос времени, когда предложение аналитических навыков догонит спрос на них.

Конфиденциальность клиента

Но, вероятно, самая сложная проблема заключается в праве клиента на неприкосновенность частной жизни. Финансовая отрасль в целом регулируется целым рядом законов, которые были приняты с целью защитить неприкосновенность частной жизни потребителей и избежать дискриминационных практик. Они были дополнены рядом строгих правил, регулирующих сбор данных, обо всех из них юридические отделы страховых компаний должны быть в курсе.

Настолько же важным является то, как страховые компании относятся к информации о клиентах. Конечно, здорово представлять себе мир, управляемый телематикой, но многие потребители справедливо боятся передачи их личных данных частной компании. И даже соблазна в виде дешевой страховки может быть недостаточно, чтобы изменить их мнение.

Специалисты по данным в области страхования также должны быть очень осторожны, в том, чтобы случайно не взять на себя роль большого брата, в независимости от того, насколько благи их намерения. Несмотря на опасения, даже большие данные не могут рассказать о человеке все.

В качестве примера я расскажу вам поучительную историю о Натали Бланшар из Квебека.

В 2009 году Бланшар ушла на больничный из-за приступа тяжелой депрессии. Как-то она пришла в банк и обнаружила, что ей перестали выплачивать пособие в рамках медицинского страхования.

Почему? Сотрудники ее страховой компании в поисках информации о клиенте, зашли на профиль Бланшар в Facebook, где были выложены фотографии, на которых она улыбалась. Компания решила, что депрессия у нее не настолько сильная, чтобы быть нетрудоспособной.

История «анализа данных и страхования»

«У большинства проблем есть множество решений или нет ни одного. Только для некоторых проблем есть единственное решение», – Эдмунд К. Беркли

Страхование было и остается игрой с числами. Каковы шансы, что корабль утонет? Что глава домохозяйства преждевременно умрет? Что деревянный дом сгорит? Начиная с третьего тысячелетия до н.э. люди пытались защитить себя от подстерегающих их опасностей.

Следить за рисками можно только зная числа - данные. С течением времени использовались все более сложные методы для расчета вероятности того или иного события. Три с половиной столетия назад, «знание чисел» созревало в математике риска, т.н. актуарной науке – одной из основ современного анализа данных.

Рождение актуарной науки

В конце 17 века спрос на долгосрочное страхование (например, ритуальное страхование, страхование жизни и ренты) становилось все труднее игнорировать.

Страховые компании были рады предложить потребителям эти услуги, но они столкнулись с различными статистическими головоломками в понимании их данных:

  • Какова вероятность смерти застрахованного в течение определенного временного периода?
  • Как цены должны назначать страховщики на свои услуги?
  • Какой процент премии они должны выделять для оплаты будущих пособий (например, ренты)?
  • Сколько они могут позволить себе инвестировать в другие области? Какой будет процентная ставка?

Таблица Граунта и аннуитеты Галлея

К счастью, математика достигла точки, где она могла дать ответы на эти вопросы. В 1662 году Джон Граунт, галантерейшик из Лондона, провел исследование отчетов о смертности в городе.

В своем анализе он построил прогнозные модели долголетия и смертности в группах людей того же возраста. На основании этих данных он смог вычислить вероятность выживания. Его работы стали основой первой «таблицы дожития».

Тридцать лет спустя, в 1693 году, Эдмонд Галлей немного отвлекся от вычисления орбит комет и погружения в скафандре на дно Темзы и опубликовал статью о пожизненных аннуитетах.

На базе чрезвычайно точных демографических данных из Бреслау в Силезии, Галлей подготовил таблицу смертности населения, организованной по возрасту и выживанию. Исходя из этой информации, он смог вычислить размер премии, которую любой мужчина или женщина ежегодно должны были уплачивать, чтобы купить пожизненный аннуитет. Начиная с этого времени актуарные данные многократно увеличились в объеме.

Отец компьютера и его потомки

На протяжении последующих нескольких столетий актуарная наука росла как в плане своей популярности, так и в сложности расчетов, не отставая от увеличивающегося объема данных. Неудивительно, что Чарльз Бэббидж, отец компьютера, нашел время, чтобы посвятить ей немного своего времени.

В 1820-х он создал актуарные таблицы из данных о смертности Общества справедливости и опубликовал удобное руководство для страховой отрасли под названием "Сравнительный взгляд на различные учреждения обеспечения жизни".

Но только с появлением перфорартных машин и первых компьютерных технологий страховая отрасль начала путь к доминированию данных.

В конце 1930-х Эдмунд Беркли из страховой компании Prudential начал исследовать потенциал вычислительных машин и, позже, компьютеров.

Послевоенный бум

Коллеги в равной степени считали Беркли чудаком и гением, Беркли же стал пионером в области вычислений и обработки данных. В 1947 году он уговорил Prudential приобрести один из первых компьютеров UNIVAC производства Eckert-Mauchly Computer Corporation.

Компьютеры поступили как раз вовремя. С фронта возвращались юноши и начинали обзаводиться хозяйством. Рождаемость переживала бум. Из-за системы регулирования заработной платы, предложения по медицинскому страхованию, оплачиваемые работодателями, становились все популярнее.

Как пишет Джоан Йетс, с 1948 по 1953 год:

  • Количество действующих страховых полисов увеличилось более, чем на 24%
  • Общая занятость в отрасли страхования жизни выросла почти на 14%

Крупные страховые компании адаптировались достаточно быстро. В книге Цифровая рука: Том II: Как компьютеры изменили работу индустрии финансов, телекоммуникаций, средств массовой информации и развлечений, Джеймс Кортада отмечает, что к концу 1955 года в отрасли использовалось более 20 мейнфрейм систем.

Консолидация данных

Следующий большой скачок пришелся на конец 1960-х и 1970-х годов. В игру вступали более мощные машины и лучшее программное обеспечение. Онлайн системы позволяли работникам свободно обмениваться информацией и посылать запросы в режиме реального времени. Инвестиции в технологии неуклонно росли.

В 1980-х отрасль страхования возглавил IT-тренд. В ходе исследования, проведенного в конце 1980-х Бюро трудовой статистики США, было установлено, что:

  • Почти каждая страховая компания использовала онлайн системы и системы мейнфрейм в своей работе
  • Более 90% из них пользовались ПК, и почти половина этих ПК были объединены в сети
  • 50% компаний пользовались в работе электронной почтой

В дополнение к данным, которые обрабатывались в самой компании, страховые агенты занимались получением дополнительной информации для профилирования клиентов.

Вперед, к звездам!

Появление Интернета в 1990-х стимулировало еще более быстрое развитие науки о данных в страховой отрасли.

  • Теперь потребители могли обходиться без услуг посредников и покупать страховые полисы на своих собственных условиях.
  • Появлялось все больше вебсайтов компаний и потребителей их услуг для удовлетворения этого спроса.
  • Банки использовали эту возможность, чтобы расширить свое присутствие в отрасли.

Как следствие, количество собираемых о клиентах данных и их обработка перешли в стадию взрывного роста.

В то же время затраты на обработку данных и хранения быстро снижались. Вместо массового моделирования, используемого в прошлом, страховые компании получили возможности (и технические инструменты) для расчета рисков на индивидуальном уровне. Наступление эру больших данных было не за горами.