Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Data-centric MLOps BigData и машинное обучение

Доклад принят в программу конференции
Дмитрий Евстюхин
Provectus

Senior Cloud Solutions Architect с опытом построения широчайшего спектра систем с использованием Kubernetes и нативных облачных сервисов. Глубокая экспертиза в DevOps-методологии и CI/CD-процессах.
На данный момент выступает консультантом в нескольких компаниях.
Ведет проекты, связанные с построением микросервисных, data- и ML-платформ, а также миграции в облака.

Linkedin - linkedin.com/in/devstiukhin/
Telegram - @Myafk
Тезисы

MLOps — термин, который уже успел набить оскомину у всего AI/ML-комьюнити. И, тем не менее, внедрение MLOps как никогда критично, потому что каждый день появляются новые практики и инструменты по работе с данными. Осталось только разобраться, почему критично и причем тут данные — об этом и поговорим.

В первой части доклада я расскажу:
- Что такое MLOps и зачем он нужен.
- Кто за что отвечает в MLOps (невероятно актуальный вопрос).
- Какие компоненты составляют MLOps и как (зачем) их собирать вместе.
- Как правильно выстроенный MLOps-процесс может сделать вашу жизнь лучше.

Затем мы поговорим про данные:
- Откуда взялся тренд на важность данных?
- Имеет ли он вообще смысл?
- Обсудим последние исследования.
- Поговорим о том, что думают лидеры рынка, такие как Andrew Ng.
- Затронем и мой собственный опыт в Provectus.

Наконец, нельзя не обсудить решения — расскажу, как про общие моменты (например, как прокачать дата-пайплайны), так и о конкретных решениях, в том числе и об OpenDataCatalog, который разрабатывается командой Provectus.

Другие доклады секции BigData и машинное обучение