Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Человек-вектор и подъем конверсии: как мы сделали шаг к Federated Learning BigData и машинное обучение

Доклад принят в программу конференции
Артем Просветов
CleverDATA / ЛАНИТ

Окончил МФТИ и аспирантуру МФТИ, кандидат физ.-мат. наук. Развивает свою экспертизу в области Data Science и Deep Machine Learning. Долгое время работал в Институте Космических Исследований, последняя позиция была ведущего математика. Имеет ряд научных публикаций по анализу временных рядов и наблюдательных данных, неоднократный призер научных конкурсов. Дополнительно проводит курс лекций на тему Big Data на площадках «Нетология» и OTUS, а также читает курс лекций по анализу данных в ВШЭ.
В CleverDATA занимается разработкой и настройкой рекомендательных систем, построением предсказательных моделей (отток, LTV, anti-fraud и т.д.), моделей Lookalike, а также работой с текстовыми данными (Natural Language Processing), в том числе для анализа блогосферы.

Анастасия Семенова
CleverDATA

Закончила Институт математики, механики и компьютерных наук им. Воровича ЮФУ с отличием по специальности «Математика» – материалы дипломной работы по теме «Критерий обратимости оператора свёртки с ядром радиального типа на группе Гейзенберга» представлены и опубликованы в тезисах международной конференции «Современные проблемы теории операторов и гармонического анализа и их приложения VI». Магистр математики НИУ ВШЭ (факультет математики). Участник летней школы «Современная математика». В CleverDATA занимается NLP (Natural Language Processing) анализом больших данных биржи данных, через которую проходит более 100 млн профилей в день.

Тезисы

Мы реализуем продукт, который позволяет преобразовать пользовательскую историю web-браузера в n-значный числовой вектор (embedding). Для преобразования неструктурированной информации о пользователе в векторный вид используется совокупность методов и моделей машинного обучения.

Использование полученного векторного описания человека целесообразно в различных рекомендательных моделях, адаптации сайтов, решение проблемы холодного старта и т.п. и представляет собой удобный материал для быстрого и безболезненного использования в моделях машинного обучения. Про наши эксперименты и полученные результаты пойдет речь в докладе.

Важным преимуществом использования представления человека в виде числового вектора является деперсонификация и анонимизация профиля человека, поэтому одной из перспектив использование модели является обучение в режиме Federated Learning в контуре заказчика.

Другие доклады секции BigData и машинное обучение