Вопрос проверяет умение выбирать информативные метрики и визуализации для контроля высоконагруженных сервисов.
Короткий ответ
Имеет смысл строить дашборды вокруг latency, error rate, throughput и saturation. Они дают целостное понимание состояния сервиса. Метрики нужно агрегировать по endpoint и типам ошибок. Отдельно полезны дашборды по внешним зависимостям и БД. Хороший дашборд позволяет быстро ответить, «что сломалось и где».
Длинный ответ
Зарегистрироваться
Развернутый ответ доступен только зарегистрированным пользователям.