Главная
→
2016
→
BigData и машинное обучение

Семантическое ядро рунета - высоконагруженная сontent-based рекомендательная система реального времени на базе Amazon Kinesis/Lucene
BigData и машинное обучение

Доклад принят в Программу конференции

1С-Битрикс

Окончил Донской Государственный Технический Университет.
Работал советником в Администрации Президента России по Южному федеральному округу, в Юго-Западном банке Сбербанка России, ведущим разработчиком веб-студии QSoft и главой отдела разработки компании «Софтлайн Интернет Трейд».

В «1С-Битрикс» курирует направление контроля качества интеграции и внедрений, активно участвует как архитектор и разработчик в проектах компании, связанных с высокой нагрузкой и отказоустойчивостью («Битрикс24»), консультирует партнеров и клиентов по вопросам архитектуры высоконагруженных решений, эффективному использованию технологий кластеризации продуктов «1С-Битрикс» в контексте современных облачных сервисов (Amazon Web Services и др.).
Эксперт в области BigData, разработки программного обеспечения, системного анализа и проектирования.
Постоянный спикер отраслевых конференций и семинаров по интернет-тематике («РИФ+КИБ», RIW, HighLoad, РИТ++, CodeFest, FailOver Conference и др.).

Тезисы

Зал «Рио-де-Жанейро»

8 ноября, 17:00

Семантическое ядро рунета - высоконагруженная сontent-based рекомендательная система реального времени на базе Amazon Kinesis/Lucene / Александр Сербул (1С-Битрикс) from Ontico

В докладе мы поделимся опытом создания content-based рекомендательной системы для электронной коммерции, работающей на семантическом ядре рунета (десятки миллионов профилей). Расскажем, как организовали централизованный сбор и обработку информации о посещении пользователями более 100 000 сайтов различной направленности на основе Amazon Kinesis. Поделимся опытом многопоточной онлайн-индексации потоков данных в Lucene. Продемонстрируем используемые базовые алгоритмы ранжирования и формирования персональных рекомендаций для посетителей более 20 000 интернет-магазинов.

Поговорим о плюсах и минусах лямбда-архитектур и обоснуем выбранное нами архитектурное решение. Отдельно остановимся на тонкостях технической реализации многопоточных алгоритмов и особенностях обеспечения реального времени - поступившая информация о действиях посетителя практически мгновенно учитывается рекомендательным движком, обеспечивая максимальную конверсию.

Другие доклады секции
BigData и машинное обучение

Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный интервал времени в прошлом

Константин Игнатов

Qrator Labs

Сегментируем 600 млн. пользователей в режиме реального времени каждый день. HBase/Kafka на службе DMP

Артем Маринов

Data-Centric Alliance

Пайплайн машинного обучения на Apache Spark

Павел Клеменков

Rambler&Co

Профессиональная конференция разработчиков высоконагруженных систем

Семантическое ядро рунета - высоконагруженная сontent-based рекомендательная система реального времени на базе Amazon Kinesis/Lucene BigData и машинное обучение

Тезисы

Другие доклады секции BigData и машинное обучение

Семантическое ядро рунета - высоконагруженная сontent-based рекомендательная система реального времени на базе Amazon Kinesis/Lucene
BigData и машинное обучение

Другие доклады секции
BigData и машинное обучение