Конференция завершена. Ждем вас на Saint HighLoad++ в следующий раз!

Будни Дата-Сайентиста: Где Дата, Зин? BigData и машинное обучение

Доклад отклонён
Тезисы

“Маша спрашивает: где у вас тут данные? А утром Паша спрашивал. Вот и Петя идет. А работать когда? И где же взять данные для той модели. Доступ давай, датасеты ищи. А мог бы пивом на балконе наслаждаться.”

Удобный поиск данных подходящего качества внутри компании и совместная работа над ними способна сократить время на подготовку к созданию модели в разы. Сегодня мы поговорим, как это сделать. Обсудим следующие темы:

- Первый день работы Дата-Сайентиста. Что он должен знать и как его онбордить?
- Дата-Сайентист в стране чудес: кто, где, когда? (создавал, менял и использовал датасеты)
- Видишь данные? А они есть! Data Science 404: Все, что вы хотите, но не можете понять для старта
- Метрики, линедж, и тесты: качество данных. А что, так можно было?
- Алерты: если ждешь специального знака, то это он.
- Дата даунтайм - враг человека. Как и почему падают ваши продукты.
- Взаимодействие между командами: откуда данные приходят и куда идут?
- Как сделать лучшую модель быстро, бесплатно и без SMS

Вы узнаете, как тратить меньше времени на поиск и оценку данных, быть увереннам в датасетах, не отвечать на лишние вопросы в Slack, перестать тушить пожары и начать получать модели лучшего качества.

Дмитрий Евстюхин
Provectus

Senior Cloud Solutions Architect с опытом построения широчайшего спектра систем с использованием Kubernetes и нативных облачных сервисов. Глубокая экспертиза в DevOps-методологии и CI/CD-процессах.
На данный момент выступает консультантом в нескольких компаниях.
Ведет проекты, связанные с построением микросервисных, data- и ML-платформ, а также миграции в облака.

Linkedin - linkedin.com/in/devstiukhin/
Telegram - @Myafk

Другие доклады секции BigData и машинное обучение