Вопрос проверяет понимание архитектуры и назначения Apache Kafka.
Apache Kafka — это распределенная streaming платформа для обработки событий в реальном времени. Она работает как publish-subscribe система, где производители отправляют сообщения в топики, а потребители читают их. Kafka обеспечивает высокую пропускную способность, отказоустойчивость и масштабируемость.
Kafka — это мощная платформа для обработки потоков данных в реальном времени.
Основные концепции:
Топики (Topics): категории или feed name, куда публикуются сообщения
Производители (Producers): приложения, которые отправляют сообщения в топики
Потребители (Consumers): приложения, которые читают сообщения из топиков
Брокеры (Brokers): серверы Kafka, образующие кластер
Партиции (Partitions): топики делятся на партиции для параллельной обработки
Архитектура Kafka:
Producers → Kafka Cluster (Brokers + Topics) → ConsumersПреимущества Kafka:
Высокая пропускная способность (миллионы сообщений в секунду)
Отказоустойчивость (репликация данных)
Сохранение сообщений в течение configurable retention period
Поддержка потоковой обработки
Пример использования:
Обработка логов в реальном времени
Сбор метрик и мониторинг
Event-driven архитектура
Синхронизация данных между системами