Чому “витримає” — не відповідь
Планування навантаження — це числа: RPS, p95, error budget, ресурси і запас. Без цього пікові періоди перетворюються на інциденти.
1) Збери базові метрики
- RPS по ключових ендпоїнтах.
- p95/p99 latency і error rate.
- DB: CPU, connections, slow queries, locks.
- Черги: lag, retry rate, dead‑letter.
2) SLO і цілі тестів
Тест навантаження має перевіряти конкретне: “при 500 RPS p95 < 300ms, помилки < 0.1%”. Інакше результат неможливо інтерпретувати.
3) Навантажувальні тести
- Ramp‑up: поступово збільшуй навантаження.
- Soak: тримай навантаження довго, щоб зловити memory leaks.
- Peak: короткий “пік” для гіршого сценарію.
4) Autoscaling без ілюзій
Scaling допомагає, якщо bottleneck — CPU/пули, а не зовнішній сервіс чи БД. Для БД потрібні окремі стратегії: індекси, read replicas, кеш.
Підсумок
Capacity planning — це регулярний цикл: метрики → SLO → тести → покращення → повтор. Так high‑load стає керованим.