Отказоустойчивое Такси, или Как мы строим надежный сервис Архитектуры, масштабируемость

Доклад принят в программу конференции
Максим Педченко
Яндекс.Такси

Последние несколько лет работает в Яндекс.Такси, где придумывает архитектуры различных компонентов сервиса.
Любит писать код на С++.

Тезисы

При недоступности приложения Такси пользователь в пару кликов уходит к конкуренту. Поэтому отказоустойчивость — наш приоритет.

Я расскажу:
- как мы незаметно переживаем отказ почти любых сервисов: сервиса конфигов, A/B-тестов, оплаты поездок и других;
- как мы незаметно переживаем отказ различных СУБД;
- как и зачем мы сделали свой circuit breaker;
- как наша микросервисная архитектура помогает отказоустойчивости и она же постоянно провоцирует факапы;
- как hot-reload-конфиги и A/B-тесты спасают;
- зачем мы обернули основные API endpoints в декларативно конфигурируемый API Gateway.

Другие доклады секции Архитектуры, масштабируемость