12 практик для эффективного решения инцидентов DevOps и эксплуатация

Доклад принят в программу конференции
Иван Круглов
Databricks

Senior Staff Engineer и Tech Lead в Databricks.

Тезисы

И вот это случилось... Ваша система или сервис не работает и ее нужно срочно починить. Вы и команда в полной боевой экипировке запрыгнули в Zoom/GoogleMeet/Skype чтобы быстро все починить... Но тут что-то пошло не так. Все перебывают друг-друга, действия плохо скоординированы, не понятно что происходит и в чем причина проблемы, настройки меняются так, что все становится только хуже. Мой доклад о том, какие практики можно и нужно применять чтобы индцеденты решались быстро и эффективно.

Другие доклады секции DevOps и эксплуатация