Почему обычно трейсится только часть трафика и какие данные при этом собираются?

Question

Трейсинг всех запросов создавал бы слишком большую нагрузку на систему хранения и обработки данных. Поэтому используется sampling — трассируется только часть запросов. Обычно собираются данные о времени выполнения, цепочке сервисов, статусах и метаданных запроса. Этого достаточно для анализа производительности и ошибок.

YeaHub · Accepted Answer

В распределенных системах поток запросов может достигать миллионов в минуту, поэтому полный трейсинг слишком дорог.Почему используют samplingОсновные причины:уменьшение нагрузки на storageснижение сетевого трафикаускорение обработкиОбычно трассируется:1% запросовили только медленные запросыКакие данные собираютсяTrace обычно содержит:Trace ID — идентификатор запросаSpan — отдельные этапы выполнениявремя выполнениястатус ответатеги и метаданныеКак выглядит структураTrace
  ├─ API Gateway
  ├─ User Service
  └─ Database
Можно увидеть, где произошла задержка.ВыводSampling позволяет получать диагностическую информацию о системе без значительных накладных расходов на хранение и обработку трассировок.

Почему обычно трейсится только часть трафика и какие данные при этом собираются?

Короткий ответ

Длинный ответ

Почему используют sampling

Какие данные собираются

Как выглядит структура

Вывод

Почему обычно трейсится только часть трафика и какие данные при этом собираются?

Короткий ответ

Длинный ответ

Почему используют sampling

Какие данные собираются

Как выглядит структура

Вывод