Ускорение и облегчение моделей для поддержания диалога виртуальных ассистентов Салют Нейронные сети, искусственный интеллект

Программный комитет ещё не принял решения по этому докладу

Тезисы

Команда SberDevices активно разрабатывает виртуальных ассистентов Салют. Мы используем технологии AI для распознавания голоса и обработки естественного языка, чтобы наши помощники умели вести беседу и приносили реальную пользу людям.

Для этого постоянно приходится решать различные nlp-задачи. Мы адаптируем и обучаем большие языковые модели на базе трансформеров (BERT, GPT), которыми делимся с сообществом в open source:

https://habr.com/ru/company/sberbank/blog/524522/
https://habr.com/ru/company/sberdevices/blog/547568/

С одной стороны, возникает большое количество специфичных задач: например, классификация сообщений, выделение именованных сущностей, определение интентов, моделирование диалога, а с другой – необходимость быстрого инференса в условиях большой нагрузки.

В рамках доклада мы поделимся своими практиками, как эффективно обучать большие multitask-модели, быстро собирать необходимые данные и, самое главное, как оптимизировать использование ресурсов памяти и ускорять модели в продакшене.

Ибрагим Бадертдинов

SberDevices

Занимается машинным обучением в SberDevices, специализируется на NLP.

https://t.me/ibragim_bad

Александр Абрамов

SberDevices

Занимается машинным обучением 7 лет. Главный эксперт по технологиям ИИ. Руководитель команды «нейронные сети» в SberDevices, участник команды разработчиков GigaChat, AI-евангелист, автор ruSBERT, kaggle, competition master.

https://t.me/dealer_ai

Другие доклады секции Нейронные сети, искусственный интеллект

Когда трансформеры врут: как мы "дружили" NLP-решения с высокими требованиями к качеству

Артем Бондарь

Voximplant

Машинное обучение в продакшне – это просто! Нужно только...

Михаил Марюфич

VK, Одноклассники

Прогноз временных рядов с помощью ансамбля нейронных сетей. Практический пример — прогноз будущего оборота подключенных проектов

Александр Толмачев

Ozon

NLP At Scale: вся правда о предобученных моделях в Почте Mail.ru

Дмитрий Меркушов

Mail.ru Group