Университет ИТМО и Банк «Санкт-Петербург» развивают методы поведенческой аналитики на основе «больших данных»

В петербургском филиале ВШЭ прошла 10-я Международная конференция по социальной информатике SocInfo 2018. Ежегодно эксперты из разных стран и областей собираются на междисциплинарной площадке, чтобы на примере собственных проектов объяснить, как применяются информационные технологии в изучении социальных явлений. Одним из докладчиков этого года стал Данила Ваганов – магистрант второго года обучения кафедры высокопроизводительных вычислений и сотрудник НИИ НКТ Университета ИТМО. Данила рассказал о методах перспективной аналитики больших массивов транзакционных данных, которые разрабатываются исследователями Университета ИТМО совместно с Банком «Санкт-Петербург» в рамках профильной международной лаборатории Российского Научного Фонда.

SocInfo – междисциплинарная площадка для исследователей из области информатики, социальных наук и наук управления. В рамках конференции представители этих областей делятся идеями и мнениями, а также представляют оригинальные исследовательские работы по изучению взаимодействия социально-ориентированных платформ и социальных явлений. Конечная цель социальной информатики – создание лучшего понимания социально-ориентированных платформ. На конференции спикеры рассказывают, как применяются информационные технологии в изучении социальных явлений, какие социальные концепции используются в проектировании информационных систем, как применяют вычислительные алгоритмы для содействия изучению социальных систем и человека в социальной динамике и другое.

Совместный проект Университета ИТМО и Банка «Санкт-Петербург» стартовал год назад. Ученые Университета разрабатывают новые подходы к извлечению закономерностей финансового поведения людей из больших массивов данных и создают на их основе предсказательные модели для оптимизации операционной эффективности, совершенствования клиентских сервисов, персонализации взаимодействий с клиентом. В рамках исследования Данилы изучалась возможность прогнозирования популярности категорий трат среди людей с различными типами платежного поведения. Алгоритмы кластеризации и предсказания категорий строились на массиве анонимизированных данных по транзакциям дебетовых карт за 2012–2014 годы.

 «Этот проект – плод долгого сотрудничества. На первом этапе в контуре Банка была развернута «технологическая песочница» – специальная среда для безопасного исполнения кода и работы с данными, которая служит своего рода полигоном для создания, настройки, валидации и тестирования предсказательных моделей. После чего был сформирован ряд кейсов для изучения, представляющих одновременно научный и практический интерес», – объяснил Данила Ваганов.

При необходимости данные об истории использования финансовых продуктов и сервисов для различных страт клиентов могут быть обогащены информацией из внешних источников: новостных агрегаторов, профильных сайтов, тематических форумов и дискуссионных площадок. Такой подход позволяет выявлять закономерности финансового поведения людей на популяционном уровне, а также исследовать взаимосвязь финансового и социального поведения.

По словам исследователя, одновременный анализ информации о большом числе «цифровых следов» позволяет преодолеть проблему разреженности индивидуальных цепочек событий и выделить основные тренды поведения клиентов. Так, в результате работы удалось выделить устойчивые кластера категорий с частыми переходами между ними.

«Предпринятый нами анализ ставил целью проверить гипотезу о наличии «цикла платежного опыта» клиента при использовании им дебетовой карты. Так, в исследовании Mastercard было отмечено, что спектр категорий трат клиента расширяется с течением времени, начинаясь с традиционно частых (супермаркеты, заправки) и постепенно включая другие варианты использования дебетовой карты (например, покупки в интернет-магазинах). Поэтому в моей работе я исследовал графы переходов между категориями, используя при этом методы Network Science (анализа комплексных сетей)», – комментирует Данила.

Полученные результаты помогут Банку лучше понимать области платежных интересов своих пользователей, исходя из которых могут формироваться специальные предложения, скидки и предложения по кешбеку. Анализ клиентского спроса позволит определить, какое банковское предложение потенциально может заинтересовать клиента.

«В процессе работы стало очевидным, что сеть переходов между векторами ежемесячных трат должна быть многослойной. Это связано с тем, что некоторые категории присутствуют существенно чаще, чем другие. После отделения слоя с самыми частыми категориями нам удалось выделить интерпретируемые кластеры часто встречающихся вместе категорий. Каждый такой кластер приблизительно соответствует отдельному типу платежного поведения клиентов. Мы анализировали сети переходов в краткосрочной и среднесрочной перспективе и пришли к выводу о том, что предположение о принадлежности цепочки одному из выделенных кластеров позволяет существенно снизить неопределенность при прогнозировании дальнейших переходов между категориями», – сказал магистрант.

Исследователи применяют базовый анализ данных и различные методы кластеризации для подготовки групп моделей покупки с оценкой вероятностей переходов между ними для цепей транзакций и для цепей ежемесячных платежей. Дальнейшие исследования в этом направлении должны включать в себя тестирование различных методов машинного обучения и прогнозирования временных рядов, а также применение точечных стохастических процессов для включения зависимостей между временными шагами более сложным образом. Работу над проектом одновременно ведут несколько подразделений НИИ НКТ Университета ИТМО.

Редакция новостного портала
Архив по годам:
Пресс-служба