HighLoad++ 2015 завершён! Ждём вас в 2016 году!

Профессиональная конференция разработчиков высоконагруженных систем

2 и 3 ноября 2015 Крокус-Экспо МОСКВА
Профессиональная конференция разработчиков высоконагруженных систем

BigData & machine learning

Первые заявки в новой секции HighLoad++

В программе HighLoad++ 2015 года шесть новых секций и одна из них — BigData, сбор и анализ больших данных, а также машинное обучение.

Вторая, выполненная Программным комитетом из пожеланий сообщества, задача — получение заявки от Павла Велихова, директор по науке стартапа TopRater.com.

TopRater.com: Машинное понимание миллионов отзывов или как быстро получить BigData из NLP и Machine Learning

Мы строим сервис TopRater.com, который должен агрегировать в себе все мнения из интернета относительно массы объектов e-commerce. Для этого мы "прочитали" миллионы отзывов и научились выделять из них сущности, аспекты, тональности и факты. При этом, хотя объемы данных кажутся маленькими для специалистов Big Data (всего несколько терабайт) — почти во всех задачах нам пришлось использовать технологии Big Data — сотни серверов на Google Cloud, Apache Spark, MPP Базы данных.

В докладе в форме "галопом по Европам" будет рассказано о гибридных подходах к NLP и машинному обучению, будут всякие интересные простые решения (некоторые широко-известные, но как показывает практика, часто забыты), ну и конечно немного про Deep Learning. А также про наш кластер и как там все организовано.

Машинное обучение для фильтрации трафика

QRator Labs

В докладе QRator Labs будут продемонстрированы основные области науки о данных, применимые в задачах защиты от DDOS атак. Мы расскажем о машинном обучении с обратной связью:

  • от окружающей среды (теория управления/control theory),
  • от данных (кластеризация, unsupervised learning),
  • от внешнего источника (обучение с учителем — классификация и регрессия — supervised learning).

Сделан акцент на сложности алгоритмов и времени, необходимом для обучения. Показано, что для построения надёжной и эффективной системы защиты, необходимо заблаговременно подготовить данные о защищаемой системе, настроить и обучить механизмы защиты.

Тень на HighLoad++ по мнению Google Deep Dreams

Погружение в машинное обучение

Также мы ждём ещё заявки от отдела Data Mining в Mail.RU, доклады про машинное обучение и распознавание картинок от Badoo, а также целый блок искусственного интеллекта от Avito:

  • Цифровое зрение — поиск контактов на картинке (GPU, нейросеть);
  • CTR Prediction;
  • Как выигрывать соревнования по анализу данных;
  • Ускорение исследований за счет организации конкурсов: как их готовить и использовать результаты.

Интересно? Присоединяйтесь!

Rambler's Top100