Когда работает не только на твоем ноутбуке. Опыт управления сетью в облаке Архитектуры, масштабируемость

Доклад принят в программу конференции
Дмитрий Бурмистров
Mail.ru Cloud Solutions

Разработчик IaaS-направления в облачной платформе Mail.ru Cloud Solutions. Последние несколько лет занимается разработкой и эксплуатацией системы управления и оркестрации публичного облака.

Тезисы

Часто бывает необходимо написать ПО, которое что-либо автоматизирует. В контролируемой среде это не доставляет особых проблем. Однако не всегда возможно обеспечить приложению столь идеальные условия функционирования. Что угодно может пойти не так, особенно в распределённой системе.

Поломки железа, отказы соседних сервисов, потеря связанности между компонентами сети — всё это типичные условия эксплуатации любого облака, и мы должны штатно с этим работать. Как обрабатывать сбои, поддерживать систему в желаемом состоянии, обеспечивать быстроту настройки и предсказуемость её поведения?

При создании собственного SDN-решения мы постарались следовать принципам построения автоматических систем с замкнутым контуром управления. На примере разработки контроллера SDN мы расскажем о причинах нашего выбора, пользе и практике применения системы обратной связи, а также о том, как этот путь повышает качество наших систем и защищает от многих аварий, в том числе таких непоправимых, как потеря пользовательских данных.

Мы глубоко убеждены, что такой подход может и должен применяться в сервисной и инфраструктурной разработке чаще, чем это есть сейчас.

Микросервисы, SOA
,
Архитектурные паттерны
,
Отказоустойчивость
,
Оптимизация производительности
,
Распределенные системы
,
Методы и техника разработки ПО
,
Критерии выбора технологий для проекта
,
Логирование и мониторинг
,
Технологии отказоустойчивости и катастрофоустойчивости, бэкапы

Другие доклады секции Архитектуры, масштабируемость