Всем привет. У меня есть локальное окружение с постгрессом, там

Question

Всем привет. У меня есть локальное окружение с постгрессом, там

находится чуть больше 1 млн строк. Сама таблица представляет из себя нечто следующее:

CREATE TABLE my_table (
id NOT NULL PRIMARY KEY,
...
search_title VARCHAR NOT NULL,
another_search_field VARCHAR NOT NULL,
deleted TIMESTAMP
)

Другие поля просто опустил за ненадобностью в данном вопросе. Так вот, у меня там был обычный составной индекс для (search_title, another_search_field). Начал анализировать планировщика запросов и понял, что индексы у меня не используются. Важно уточнить, что у меня в запросах имеется LIKE оператор, т.е это выглядит примерно так:

SELECT * FROM my_table WHERE search_title LIKE '%some title%' AND another_search_field = '...';

В общим, анализ (EXPLAIN (analyze,verbose,timing,costs,buffers)) мне показывает, что у меня используется последовательный поиск для запроса

Запрос:

SELECT id FROM my_table WHERE search_title LIKE '%title%'

Результат:

Seq Scan on public.my_table (cost=0.00..40873.66 rows=1052908 width=16) (actual time=0.050..7154.845 rows=1053013 loops=1)
Output: id
Filter: ((mt_table.search_title)::text '%title%'::text)
Buffers: shared hit=192 read=27519
Planning Time: 0.069 ms
Execution Time: 13513.829 ms

На всякий случай отключил последовательную прогонку, но в итоге результат всё равно такой, что индекс не используется. Понятное дело, что set enable_seqscan = off не форсит отмену последовательной прогонки. Но, похоже, что других вариантов нет для планировщика. И в том числе нет варианта использовать индекс.

Seq Scan on public.my_table (cost=10000000000.00..10000040873.66 rows=1052908 width=16) (actual time=24.158..7218.534 rows=1053013 loops=1)
Output: id
Filter: ((my_table.search_title)::text '%title%'::text)
Buffers: shared read=27711 written=32
Planning:
Buffers: shared hit=11 read=5 dirtied=3 written=5
Planning Time: 0.730 ms
JIT:
Functions: 4
" Options: Inlining true, Optimization true, Expressions true, Deforming true"
" Timing: Generation 1.118 ms, Inlining 4.890 ms, Optimization 12.192 ms, Emission 6.884 ms, Total 25.084 ms"
Execution Time: 13776.353 ms

В итоге подумал, что проблема в том, что обычный индекс тут не особо уместен, попробовал создать GIN индекс. Потому что исходя из моих требований (поиск по LIKE) все филды текстовые, а значит и уместность, по идеи, должна быть.

CREATE INDEX trgm_idx ON my_table USING GIN (search_title gin_trgm_ops) WHERE deleted IS NULL;
Касаемо deleted, то у меня просто используется принцип soft-delete в приложении.

Короче, пробую опять. И результат тот же - индекс не используется. В итоге у меня сложилось ощущение, что я что-то упустил. Может GIN индекс тут неуместен? Может тестовые данные у меня не особо подходящие? Про второе следует уточнить, что я нагенерил 1мл записей, где в качестве поля search_title выступает следующий паттерн: UUID title UUID. Т.е условно говоря, должно быть большое кол-во страниц с повторяющимися данными для LIKE оператора. Потому что сейчас, что индекс есть (обычный или GIN), что его нет - одна репка, как говорится.

#database #dba #it #russian #software

0

21.07.2021

52 ответов

102 просмотра

Aleksandr Автор вопроса

Ilya Zviagin
Ты что-то упустил. Позже скажу, что

Интрига. Интересно узнать что именно упустил.

0

21.07.2021

72 похожих чатов

Всем привет. У меня есть локальное окружение с постгрессом, там

52 ответов

Похожие вопросы