Вопрос проверяет понимание влияния физического хранения данных на скорость аналитических операций.
При хранении по строкам считываются все поля записи, даже если нужна одна колонка. При хранении по колонкам читаются только необходимые столбцы. Это делает колоночное хранение значительно эффективнее для агрегаций и аналитических запросов.
Физическая организация данных напрямую влияет на производительность аналитики.
Строчное хранение — данные одной записи хранятся вместе.
Колоночное хранение — значения одной колонки хранятся подряд.
Агрегации обычно:
используют небольшое число колонок,
обрабатывают большое число строк.
По строкам
считываются все поля,
лишние данные нагружают память и кэш.
По колонкам
читаются только нужные столбцы,
лучше используется кэш процессора.
OLTP системы — чаще строчное хранение,
OLAP системы — чаще колоночное хранение.
Колоночное хранение значительно ускоряет агрегации за счёт уменьшения объёма считываемых данных и лучшей локальности памяти.