Вопрос проверяет умение диагностировать проблемы производительности, а не гадать по симптомам.
Узкое место ищут через метрики, логи и трассировку. Сначала смотрят на общие показатели: latency, throughput, error rate. Затем проверяют загрузку CPU, память, диск и сеть. Важно изолировать компонент, где время ответа растёт быстрее всего. Без измерений определить bottleneck невозможно.
Bottleneck — это компонент системы, который ограничивает общую производительность и рост нагрузки.
Наблюдаемость
Метрики: время ответа, количество запросов, ошибки.
Трассировка запросов между сервисами.
Сравнение компонентов
Где задержка максимальна?
Где растёт очередь или количество таймаутов?
Проверка ресурсов
CPU: высокая загрузка, context switch.
Memory: OOM, GC-паузы.
Disk: I/O wait.
Network: latency, packet loss.
Локализация
Воспроизведение под нагрузкой.
Изоляция подозрительного сервиса.
# top, htop, iotop, vmstat — быстрый старт
Bottleneck находят не интуицией, а метриками и трассировкой, постепенно сужая область поиска.