Паттерны отказоустойчивой архитектуры Архитектуры, масштабируемость

Доклад принят в программу конференции
Александр Кривощёков
Яндекс

Занимается разработкой сервисов, обслуживающих одну из самых нагруженных и комплексных частей системы — главный экран Еды. Ежедневно эти сервисы подбирают лучшие предложения для пользователей и обрабатывают трафик со всех приложений, где представлена Яндекс.Еда.

До Яндекса занимался разработкой B2B-платформы финансового моделирования для управления и оценки инвестиций в недвижимость.

В свободное время разрабатывает (но часто времени хватает только пофантазировать) узконаправленные и фановые языки программирования.

Тезисы

Перебои и ошибки в работе распределённых систем (будь то Web или IoT) — совершенно обычная ситуация. Проблемы в работе с сетью, перебои в работе зависимостей и банальный человеческий фактор — та цена, которую мы платим за общую стабильность системы, лёгкую масштабируемость и гибкость в разработке.

На примере эволюции одного вымышленного (ну, почти вымышленного) сервиса по доставке напитков мы рассмотрим проблемы, с которыми он сталкивался, и решения, которые помогли с ними справиться.

Мы разберём паттерны построения отказоустойчивой системы и примеры их реализации в реальной жизни, которые позволяют нашей системе переживать самые критические моменты. Начав с простейших таймаутов, мы проделаем путь до толстых клиентов и тыкв.

Другие доклады секции Архитектуры, масштабируемость