Почему PostgreSQL может не использовать индекс и предпочесть Seq Scan?

Question

PostgreSQL выбирает план выполнения на основе оценки стоимости, а не наличия индекса. Если планировщик считает, что последовательное сканирование будет дешевле, он выберет Seq Scan. Это часто происходит при выборке большого процента строк. Также причиной могут быть устаревшие статистики или неподходящий тип индекса.

YeaHub · Accepted Answer

Важно понимать, что PostgreSQL не обязан использовать индекс, даже если он существует.Как PostgreSQL выбирает планПланировщик оценивает несколько вариантов выполнения запроса и выбирает самый дешевый по внутренней модели стоимости.стоимость чтения страниц с дискаколичество ожидаемых строксложность операцийОсновные причины выбора Seq ScanВыбирается много строкЕсли запрос возвращает большую часть таблицы, индекс теряет смыслПоследовательное чтение дешевле множества случайных обращенийУстаревшая статистикаPostgreSQL неправильно оценивает количество строкПланировщик принимает неверное решениеТип условияИспользуются функции или выражения над колонкойИндекс не может быть примененSELECT *
FROM users
WHERE LOWER(email) = 'test@mail.com';
-- обычный индекс по email здесь не используется
Низкая селективностьВ колонке много одинаковых значенийИндекс плохо фильтрует данныеКак повлиять на выбор планаобновить статистику через ANALYZEсоздать подходящий индекспереписать условие запросаиспользовать функциональный индекс при необходимостиКраткий выводPostgreSQL выбирает Seq Scan, когда считает его более дешевым, и это чаще связано с объемом данных, статистикой и селективностью условий.

Почему PostgreSQL может не использовать индекс и предпочесть Seq Scan?

Короткий ответ

Длинный ответ

Как PostgreSQL выбирает план

Основные причины выбора Seq Scan

Как повлиять на выбор плана

Краткий вывод

Почему PostgreSQL может не использовать индекс и предпочесть Seq Scan?

Короткий ответ

Длинный ответ

Как PostgreSQL выбирает план

Основные причины выбора Seq Scan

Как повлиять на выбор плана

Краткий вывод