Отказоустойчивое Такси, или Как мы строим надежный сервис Архитектуры, масштабируемость

Доклад принят в программу конференции
Денис Исаев
Яндекс.Такси

Руководитель бэкенда пассажирского продукта в Яндекс.Такси. До этого работал в Mail.Ru Group.
Личный сайт - https://disaev.me/about/

Тезисы

При недоступности приложения Такси пользователь в пару кликов уходит к конкуренту. Поэтому отказоустойчивость — наш приоритет.

Я расскажу:
- как мы незаметно переживаем отказ почти любых сервисов: сервиса конфигов, A/B-тестов, оплаты поездок и других;
- как мы незаметно переживаем отказ различных СУБД;
- как и зачем мы сделали свой circuit breaker;
- как наша микросервисная архитектура помогает отказоустойчивости и она же постоянно провоцирует факапы;
- как hot-reload-конфиги и A/B-тесты спасают;
- зачем мы обернули основные API endpoints в декларативно конфигурируемый API Gateway.

Другие доклады секции Архитектуры, масштабируемость