Highload++ 2017 завершён!

Профессиональная конференция разработчиков высоконагруженных систем

СКОЛКОВО, Москва 7 и 8 ноября

11-я ежегодная конференция для разработчиков highload-систем, которая соберет   2 700 участников из разных регионов России и мира. Мероприятие направлено на обмен знаниями о технологиях, позволяющих одновременно обслуживать многие тысячи и миллионы пользователей.

Программа охватывает такие аспекты веб-разработок, как архитектуры крупных проектов, базы данных и системы хранения, системное администрирование, нагрузочное тестирование, эксплуатация крупных проектов и другие направления, связанные с высоконагруженными системами.

Пайплайн машинного обучения на Apache Spark
BigData и машинное обучение

Доклад принят в Программу конференции
Rambler&Co

Начинал с веб-разработки высоконагруженных систем. Несколько лет назад занялся машинным обучением и работой с большими данными. Сейчас руководит отделом машинного обучения.

Тезисы

В докладе рассмотрим нашу старую архитектуру пайплайна машинного обучения, обратим внимание на ее недостатки как с точки зрения инфраструктуры и автоматизации, так и с точки зрения настройки моделей машинного обучения и проведения экспериментов. Разберемся с архитектурой Apache Spark, и почему мы решили его использовать. Подробно ознакомимся с новой архитектурой нашего пайплайна и тем, как она позволила оптимизировать обнаружение и устранение проблем, ускорила и упростила работу data scientist'ов по проведению экспериментов и доведения их до продакшена. Также затронем вопросы написания тестов и процесса разработки ПО на больших данных.

Python
,
Оптимизация производительности
,
Распределенные системы
,
Логирование и мониторинг
,
Devops / другое
,
Аналитика / другое
,
Юнит-тестирование

Другие доклады секции
BigData и машинное обучение

Rambler's Top100