Вопрос проверяет понимание, как Kafka масштабируется и почему партиции — основа параллельной обработки и сохранения порядка.
Короткий ответ
Партиция — это часть топика, представляющая собой упорядоченный лог сообщений. Партиционирование нужно, чтобы Kafka могла масштабировать запись и чтение: разные партиции можно обрабатывать параллельно. Порядок сообщений гарантируется внутри одной партиции, но не между партициями. Продюсер обычно выбирает партицию по ключу, чтобы сообщения одного объекта шли последовательно. Чем больше партиций, тем больше потенциал для параллелизма, но тем сложнее управление.
Длинный ответ
Зарегистрироваться
Развернутый ответ доступен только зарегистрированным пользователям.