“Восстание машин” – это ок DevOps и эксплуатация

Доклад принят в программу конференции
Леонид Талалаев
Одноклассники

Ведущий разработчик в команде платформы проекта Одноклассники. Последние три года занимается разработкой внутреннего облака one-cloud, которое используется для запуска всех основных сервисов проекта.

Тезисы

Одноклассники состоят из более чем 6000 серверов, расположенных в нескольких дата-центрах. Почти половина из них являются частью нашего облака, one-cloud, про которое мы уже рассказывали два года назад на HighLoad++.

При управлении более чем 10000 контейнеров возникают типовые задачи, выполнение которых вручную отнимало бы слишком много времени и неизбежно приводило бы к человеческим ошибкам. Поэтому мы стремимся автоматизировать все процессы в облаке так, чтобы минимизировать участие человека. Такую полную автоматизацию мы назвали “Восстание машин”.

В докладе мы рассмотрим такие темы, как:
- выкладка секьюрити-патчей на все контейнеры. Заодно, научимся подменять слои docker-образа за 1 секунду;
- обеспечение доступности распределенных statefull-сервисов при операциях в облаке;
- проблема фрагментации в облаке. Расскажем, как с помощью изменения алгоритма размещения мы сэкономили миллион долларов.

Java
,
Архитектурные паттерны
,
Отказоустойчивость
,
Распределенные системы
,
Методы и техника разработки ПО
,
Алгоритмы и их сравнение
,
Технологии виртуализации и контейнеризации
,
Управление конфигурацией
,
Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
,
Инфраструктура как сервис (IaaS), платформы как сервис (PaaS)

Другие доклады секции DevOps и эксплуатация