12 практик для эффективного решения инцидентов

DevOps и эксплуатация

Доклад принят в программу конференции

Senior Staff Engineer и Tech Lead в Databricks.

Тезисы

Видео

И вот это случилось... Ваша система или сервис не работает и ее нужно срочно починить. Вы и команда в полной боевой экипировке запрыгнули в Zoom/GoogleMeet/Skype, чтобы быстро все починить... Но тут что-то пошло не так. Все перебивают друг друга, действия плохо скоординированы, непонятно, что происходит и в чем причина проблемы, настройки меняются так, что все становится только хуже.

Мой доклад о том, какие практики можно и нужно применять, чтобы инциденты решались быстро и эффективно.

Другие доклады секции

DevOps и эксплуатация