CoLES: контрастивное обучение для последовательностей событий с самоконтролем

Мы рассматриваем задачу обучения без учителя на дискретных данных в виде последовательностей событий пользователя. Обучение без учителя позволяет извлечь сложную информацию из сырых данных и преобразовать ее в числовой вектор (эмбеддинг) фиксированной длины и низкой размерности, который может использоваться как вектор признаков для любых последующих задач машинного обучения. В данной работе мы предлагаем новый метод «CoLES», который адаптирует подход контрастивного обучения, ранее использовавшееся в области аудио и компьютерного зрения, к области дискретных последовательностей событий в условиях обучения без учителя. Мы внедрили метод получения эмбеддингов CoLES на основе последовательности транзакций в крупном европейском банке. Добавление эмбеддингов CoLES как признаков значительно повышает качество уже существующих в Банке моделей машинного обучения, что приводит к значимому финансово-экономическому эффекту, оценивающемуся в сотнях миллионах долларов ежегодно. Мы также провели сравнение разных методов подготовки эмбеддингов на некоторых открытых транзакционных датсетах и показали, что эмбеддинги Coles превосходят по качеству другие методы на различных задачах машинного обучения.    

Читать еще

Управление исследований и инноваций • Управление внутрибанковской безопасности
17 апреля 23
Создание инструмента второго мнения для классического полиграфа
Асонов Дмитрий Валерьевич, Крылов Максим Андреевич, Омелюсик Владимир Степанович, Рябикина Анастасия Евгеньевна, Литвинов Евгений Вячеславович, Митрофанов Максим Алексеевич, Михайлов Максим Алексеевич, Ефимов Альберт Рувимович
Управление исследований и инноваций
Управление исследований и инноваций
08 февраля 23
Наука в Сбере 2022

Мы используем cookies и аналогичные технологии для улучшения работы сайта и повышения удобства его использования.
Условия использования описаны в Уведомлении об обработке персональных данных сайтом и Политике в отношении Сookies и аналогичных технологий для сайта.