Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Проектирование ML-ориентированной системы дедубликации контента на ЦИАН

BigData и машинное обучение

Микросервисы, SOA
Распределенные системы
Проектирование информационных систем
Machine Learning

Доклад отозван

Целевая аудитория

ML-инженеры, Data Science-разработчики, MLOps-разработчики.

Тезисы

Мы поговорим о том, как построить ML-ориентированную систему дедубликации объявлений недвижимости в условиях высокой нагрузки и при высоких требованиях к качеству работы системы. Расскажу о том, как сохранить практически линейную масштабируемость системы при росте базы в N раз. Обсудим, как разметить данные, обучить модель (с использованием текстов, картинок и численных полей), а также мониторить ее деградацию в режиме реального времени.

Team Lead в ЦИАН, Former Kaggle GrandMaster Top 10.

ЦИАН

ЦИАН

Видео

Другие доклады секции

BigData и машинное обучение