SLA — це контракт про очікування, а не “обіцянка бути онлайн 24/7”
Сильна підтримка — це коли бізнес розуміє, що буде при інциденті, а команда має правила: що робимо першими, як ескалуємо, як комунікуємо і як повертаємо систему в норму.
1) Пріоритети (severity) — основа
- P0: сервіс недоступний/втрата грошей/критична безпека.
- P1: ключова функція не працює для значної частини користувачів.
- P2: часткова деградація або обхідний шлях є.
- P3: косметика/покращення/низький вплив.
2) Response vs resolution
- Response time: як швидко ви підтвердили і почали розбір.
- Resolution time: як швидко відновили роботу/обхідний шлях.
3) Ескалація і чергування
- Канали: alert → on-call → техлід → бізнес.
- Runbook для типових інцидентів (БД, кеш, черги, платежі).
4) Комунікація
Регулярні апдейти (кожні N хв), зрозуміла мова, фіксація ETA з обережністю. Краще чесно: “діагностика триває”, ніж вигадувати.
Підсумок
Реалістичне SLA — це пріоритети, час реакції/вирішення, ескалації та прозора комунікація. Тоді підтримка не вигорає, а продукт стабільно розвивається.