11 июля 2024 года в онлайн формате состоится Incident Management Meetup СберМаркет Tech.
В программе:
- «Век учись, а инцидентов меньше не становится»
Сергей Реусин — Руководитель отдела обеспечения надёжности в СберМаркете
В индустрии последние годы много говорится о здоровой инженерной культуре, толерантности к восприятию ошибок и чёткому подходу к решению инцидентов: реакция, анализ, написание postmortem и выполнение задач на исправление. Однако статистика по запуску такого процесса показывает, что не сильно-то мы и «исправляем» системы — инциденты никуда не уходят, а зачастую даже сохраняют тенденцию к росту.
В докладе расскажет о нетривиальных выводах даже по очевидным, на первый взгляд, инцидентам, и как подобный анализ встроить в ваши процессы.
- «Координация инцидентов. The hard way»
Вадим Мартынов — Руководитель команды платформы надёжности в Яндекс Go
Инциденты — это всегда стресс, который кто-то должен принимать на себя. Доступность Яндекс Такси в продакшене 99.99%, а каждая секунда инцидента уменьшает эту цифру.
Как мы избавляемся от стресса во время инцидентов, учимся восстанавливать сервис в безопасных условиях, чем «Железная Женщина» может помочь Такси, какие инструменты позволяют сэкономить время в критической ситуации и откуда берутся новые координаторы — в докладе от команды платформы надёжности сервиса.
- «Как делиться результатами postmortem и получить максимум ценности»
Максим Бурцев — Руководитель группы управления инцидентами и проблемами в СберМаркете
Расскажет про то, как устроен «Комитет Надежности» в СберМаркете:
- что это, зачем
- какая ценность
- какие задачи
- состав комитета
- как выбрать инциденты
- как отслеживать задачи
- какие использовать метрики
- наши шишки – почему не получилось с первого раза
Incident Management Meetup
Дата проведения: 11.07.2024. Начало в 18:00
Место проведения: Онлайн
- Анонс
- Программа
- Участники
- Спикеры
11 июля 2024 года в онлайн формате состоится Incident Management Meetup СберМаркет Tech.
В программе:
- «Век учись, а инцидентов меньше не становится»
Сергей Реусин — Руководитель отдела обеспечения надёжности в СберМаркете
В индустрии последние годы много говорится о здоровой инженерной культуре, толерантности к восприятию ошибок и чёткому подходу к решению инцидентов: реакция, анализ, написание postmortem и выполнение задач на исправление. Однако статистика по запуску такого процесса показывает, что не сильно-то мы и «исправляем» системы — инциденты никуда не уходят, а зачастую даже сохраняют тенденцию к росту.
В докладе расскажет о нетривиальных выводах даже по очевидным, на первый взгляд, инцидентам, и как подобный анализ встроить в ваши процессы.
- «Координация инцидентов. The hard way»
Вадим Мартынов — Руководитель команды платформы надёжности в Яндекс Go
Инциденты — это всегда стресс, который кто-то должен принимать на себя. Доступность Яндекс Такси в продакшене 99.99%, а каждая секунда инцидента уменьшает эту цифру.
Как мы избавляемся от стресса во время инцидентов, учимся восстанавливать сервис в безопасных условиях, чем «Железная Женщина» может помочь Такси, какие инструменты позволяют сэкономить время в критической ситуации и откуда берутся новые координаторы — в докладе от команды платформы надёжности сервиса.
- «Как делиться результатами postmortem и получить максимум ценности»
Максим Бурцев — Руководитель группы управления инцидентами и проблемами в СберМаркете
Расскажет про то, как устроен «Комитет Надежности» в СберМаркете:
- что это, зачем
- какая ценность
- какие задачи
- состав комитета
- как выбрать инциденты
- как отслеживать задачи
- какие использовать метрики
- наши шишки – почему не получилось с первого раза