Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Data Lake в Kubernetes. Нестандартный подход к организации сбора и хранения данных

BigData и машинное обучение

Базы данных / другое
Архитектура данных, потоки данных, версионирование

Доклад отклонён

Целевая аудитория

- Data инженеры - DataOps специалисты

Тезисы

Использованием Kubernetes сегодня уже никого не удивишь. Как, впрочем, и объектным хранилищем. Ну и, конечно же, движки для работы с большими данными - тоже уже не новость. Однако среди существующих инструментов для работы с Data Lake есть крайне любопытный инструмент Dremio, который при правильном использовании может существенно упростить жизнь аналитиков при использовании стандартных DevOps подходов.

В итоге, это доклад про то, как пойти по тонкому льду антипаттерна, бонусом добавить green-blue deployment к моделям данных и облегчить в итоге процесс горизонтального масштабирования вычислительного кластера.

Кандидат физико-математических наук, около 10 лет суммарного опыта работы и ведения научных проектов: занимался построением и развитием алгоритмов машинного обучения для решения прикладных задач в разных сферах (от E-commerce до экологии и EdTech’а), а также оцифровки бизнеса с последующим переходом на DDD-стратегию управления. В настоящее время CDO видеосервиса more.tv, ранее руководил департаментом обработки данных в Skillbox. Доцент факультета «Информационные технологии и прикладная математика» МАИ (НИУ).

more.tv

more.tv — это все, что ты смотришь и даже больше. Тебя ждет самый широкий выбор сериалов, фильмов и развлекательных шоу для всей семьи, весь контент главных российских телеканалов в одном месте и совершенно бесплатно. Начни просмотр дома на сайте или телевизоре и продолжи в дороге в мобильном приложении в любое время. Открывай каждый день more.

В отрасли ИТ более десяти лет. Последний год руководит отделом DataOps в компании Skillbox. Занимается развитием и поддержкой платформы обработки данных, инфраструктурой для Аналитиков и ML инженеров.

Skillbox

EdTech компания, стремящаяся дать возможность каждому быть актуальным и востребованным специалистом прямо сейчас. Вне зависимости от возраста и географии

Видео

Другие доклады секции

BigData и машинное обучение