Конференция завершена. Ждем вас на Saint HighLoad++ в следующий раз!

Хранилище фич или какая-то дичь? BigData и машинное обучение

Доклад принят в программу конференции
Леонид Блохин
Provectus

Big Data Engineer.
Занимается большими данными и машинным обучением.

Linkedin: linkedin.com/in/leonid-blokhin-a62674127/
Telegram: @Leonid_blokhin
Дмитрий Евстюхин
Provectus

Senior Cloud Solutions Architect с опытом построения широчайшего спектра систем с использованием Kubernetes и нативных облачных сервисов. Глубокая экспертиза в DevOps-методологии и CI/CD-процессах.
На данный момент выступает консультантом в нескольких компаниях.
Ведет проекты, связанные с построением микросервисных, data- и ML-платформ, а также миграции в облака.

Linkedin - linkedin.com/in/devstiukhin/
Telegram - @Myafk
Тезисы

Господа, возможно, вы еще не приняли это, но, похоже, мы на пороге очередной абстракции, нам предстоит пройти через отрицание, гнев, торг, депрессию и принятие.

Настала пора абстрагировать инжиниринг данных от ML-процесса. Следующий шаг или очередной слой бесполезных препятствий для ML-разработчика?

- Связываем данные и модели,
- данные для тренинга модели и данные для предсказаний согласуем между собой,
- поддерживаем согласованность между тестовыми и продакшн-данными,
- фичи с локальных рабочих станций, как же довести это до прода.

В этом докладе мы хотим затронуть тему практического использования Feature Store в реальной жизни, разобрать на примере Open Source-проекта Feast реализацию хранилища фич, а также рассказать про интеграцию с AWS DynamoDb.

Другие доклады секции BigData и машинное обучение