Конференция завершена. Ждем вас на Highload++ в следующий раз!
Москва, СКОЛКОВО
8 и 9 ноября 2018

Monitoring: From Duty OPS to SREСистемное администрирование

Программный комитет ещё не принял решения по этому докладу
Дмитрий Куприянов
IPONWEB

Site Reliability Engineer.

Тезисы

Различия между Duty OPS и SRE заключаются главным образом в том, что Duty OPS большую часть времени тратит на решение инцидентов, эскалации и деплои. В отличие от него, SRE большую часть времени тратит на оптимизацию и автоматизацию рутинных процессов, уменьшая количество однообразной и скучной работы и увеличивая возможности по дальнейшему улучшению сети, кода и инфраструктуры.

Я расскажу о том, как мы улучшили мониторинг и уменьшили количество алертов вдвое, при этом мониторя больше и об изменении подхода к мониторингу нашей инфраструктуры в целом; приведу примеры улучшений в алертинге, репортинге, отслеживании инцидентов, автоматизации.

Логирование и мониторинг
,
Менеджмент в эксплуатации
,
Devops / другое
,
Управление / другое

Другие доклады секции Системное администрирование

Rambler's Top100