Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Computer vision API: highload ML on GPU Бэкенд, теория программирования

Доклад принят в программу конференции
Юлиана Лихолай
Mail.ru

Работает в компании Мейл.Ру на должности программиста С++.
Backend-программист системы компьютерного зрения. Занимается разработкой проектов CV более 6 лет.

Тезисы

Команда Computer Vision Mail.ru предоставляет решения для нескольких продуктов Mail.ru: Почта, Облако, Vision (b2b-продукт).

Количество работающих в проде нейросеток исчисляется десятками, но количество запросов к каждой модели разное: от 1 запроса с лендинга до 300,000 в минуту от Облака@Mail.ru. Разные архитектуры, разные паттерны нагрузки, разные фреймворки, постоянно нарастающая нагрузка на бэкенд — все это порождает серьезные сложности на пути построения универсального бэкенда. В рамках своего доклада я расскажу про самые удачные рецепты, которые зашли у нас.

Я также расскажу о том, как нам удаётся поддерживать зоопарк фреймворков (pytroch, TF, caffe, ...). Как мы используем Kubernetes для шедулинга моделей по серверам. Расскажу о преимуществе использования nvidia-docker при запуске приложений, работающих на GPU.

Другие доклады секции Бэкенд, теория программирования

Rambler's Top100