Проектирование ML-ориентированной системы дедубликации контента на ЦИАН
Доклад отозван
Целевая аудитория
Тезисы
Мы поговорим о том, как построить ML-ориентированную систему дедубликации объявлений недвижимости в условиях высокой нагрузки и при высоких требованиях к качеству работы системы. Расскажу о том, как сохранить практически линейную масштабируемость системы при росте базы в N раз. Обсудим, как разметить данные, обучить модель (с использованием текстов, картинок и численных полей), а также мониторить ее деградацию в режиме реального времени.
Team Lead в ЦИАН, Former Kaggle GrandMaster Top 10.
ЦИАН
Видео
Другие доклады секции
BigData и машинное обучение