Вопрос проверяет, понимаете ли вы, из чего складывается latency, и умеете ли проектировать быстрый путь обработки: минимальные зависимости, кэш/предрасчёт, ограничения параллелизма и контроль хвостовых задержек (p95/p99).
Короткий ответ
Сначала нужно “вписаться” в бюджет времени: сеть, сериализация, бизнес-логика, БД и внешние вызовы. Для <100 мс обычно убирают тяжёлые операции из запроса: предрасчёт, кеш, асинхронная обработка. Затем ограничивают вариативность: таймауты, лимиты, отказ от лишних сетевых прыжков. Обязательно оптимизируют доступ к данным (индексы, короткие запросы, батчи) и следят за p95/p99, а не только за средним временем. Без наблюдаемости и нагрузочного теста это не удержать.
Длинный ответ
Зарегистрироваться
Развернутый ответ доступен только зарегистрированным пользователям.