Отладка распределенных приложений: хорошая, плохая, ужасная

Архитектуры, масштабируемость

Доклад отозван

Двигает инфраструктурные проекты в Yandex.Cloud. Писал в продакшн на 20+ языках, любит Haskell, Rust и Erlang, но в последнее время пишет по ночам пока никто не видит на Python и C++.
Создатель московских Python-завтраков. Активно участвует в организации конференций.

Тезисы

Видео

Бывало ли у вас такое, что в вашем коде что-то идёт не так и вы несколько дней не можете понять в чем проблема? А теперь представьте, что это происходит только в проде под большой нагрузкой и проблемный запрос проходит через несколько десятков серверов.
Из доклада вы узнаете про универсальные приемы поиска причин таких проблем, а так же о том, как проектировать системы так, чтобы отладка отъедала меньше ваших нервов и сил.

Другие доклады секции

Архитектуры, масштабируемость