Capacity planning: як планувати навантаження, робити load testing і не ловити “падіння на піку”

Практика планування потужностей: які метрики потрібні, як ставити SLO, як робити навантажувальні тести, інтерпретувати результати і налаштовувати autoscaling без сюрпризів.

6 черв. 2026 р.

Чому “витримає” — не відповідь

Планування навантаження — це числа: RPS, p95, error budget, ресурси і запас. Без цього пікові періоди перетворюються на інциденти.

1) Збери базові метрики

RPS по ключових ендпоїнтах.
p95/p99 latency і error rate.
DB: CPU, connections, slow queries, locks.
Черги: lag, retry rate, dead‑letter.

2) SLO і цілі тестів

Тест навантаження має перевіряти конкретне: “при 500 RPS p95 < 300ms, помилки < 0.1%”. Інакше результат неможливо інтерпретувати.

3) Навантажувальні тести

Ramp‑up: поступово збільшуй навантаження.
Soak: тримай навантаження довго, щоб зловити memory leaks.
Peak: короткий “пік” для гіршого сценарію.

4) Autoscaling без ілюзій

Scaling допомагає, якщо bottleneck — CPU/пули, а не зовнішній сервіс чи БД. Для БД потрібні окремі стратегії: індекси, read replicas, кеш.

Підсумок

Capacity planning — це регулярний цикл: метрики → SLO → тести → покращення → повтор. Так high‑load стає керованим.