Как Kafka читает сообщения: по одному или батчами?

Question

Kafka читает сообщения батчами.Consumer получает набор сообщений за один poll.Это снижает накладные расходы на сеть и CPU.Размер батча можно настраивать.Такой подход обеспечивает высокую пропускную способность.

YeaHub · Accepted Answer

Kafka оптимизирована под потоковую обработку больших объёмов данных.

Основная идея

Kafka работает не с отдельными сообщениями, а с пачками данных.

Как это выглядит на практике

Consumer:

делает запрос poll()
получает набор сообщений из одной или нескольких партиций
обрабатывает их последовательно

Пример:

ConsumerRecords<String, String> records = consumer.poll(timeout);
for (ConsumerRecord<String, String> record : records) {
    // обработка
}

Почему батчи эффективнее

меньше сетевых вызовов
меньше переключений контекста
лучшая утилизация CPU

Что влияет на размер батча

настройки consumer’а
скорость обработки
задержки (latency)

Вывод

Kafka читает сообщения батчами, и это ключевая причина её высокой производительности.

Как Kafka читает сообщения: по одному или батчами?

Короткий ответ

Длинный ответ

Основная идея

Как это выглядит на практике

Почему батчи эффективнее

Что влияет на размер батча

Вывод

Как Kafka читает сообщения: по одному или батчами?

Короткий ответ

Длинный ответ

Основная идея

Как это выглядит на практике

Почему батчи эффективнее

Что влияет на размер батча

Вывод