У меня в запросе пара таблиц джойнятся по полю на равенство, поле не индексированное и не внешний ключ. Запрос долгий и приходит часто, при том один и тот же. Есть какая-нибудь технология конкретно под такой тип запроса сделать сохраняемую оптимизацию?
Я не очень знаком с технологиями различных Schema, а также View. Стоит копать в ту сторону, или там нет решения?
1) Хотя бы азы пройдите sql 2) можете скинуть сам запрос 3) описание таблиц --- И может помогут )
размеры таблиц (в строчках), число различных значений в поле? postgres-specific: таблички не раздутые? почитай про bloat
Совет читать про распухание человеку, который не в зуб ногой с SQL это действительно серьёзно?!
Серьезно конечно. Человек написал вполне вразумительный вопрос, так что соображалка есть и работает. то что в мире есть SQL - это далеко не часто используемая вещь, то можно предположить что человек просто не сталкивался с реляционными базами данных до этого.
Да я не об этом. А о том, что надо с индексов начать :) От простого к сложному.
SELECT * FROM t1 INNER JOIN t2 ON t1.a == t2.a WHERE a NOT IN (SELECT a FROM t3) Тут запрос не для индексов. надо выбрать все значения которых нет в t3, и которые есть в t1 и t2. То есть полное сканирование индексов может быть и лучше seqscan-а, но не значительно.
Да ну? Джойн и антиджойн. Прекрасно индексы помогут.
тут надо начинать с текущего плана
таблицы одинакого размера. join по индексу переберёт присоединяемую таблицу. antijoin - аналогично
test=# create table a1 as select * from pgbench_accounts; SELECT 100000 test=# create table a2 as select * from pgbench_accounts; SELECT 100000 test=# create table a3 as select * from pgbench_accounts; SELECT 100000 test=# explain select * from a1 inner join a2 on a1.aid = a2.aid where a1.aid not in ( select aid from a3 ); QUERY PLAN ---------------------------------------------------------------------------------------- Gather (cost=6632.94..14254.78 rows=50000 width=194) Workers Planned: 1 -> Parallel Hash Join (cost=5632.94..8254.78 rows=29412 width=194) Hash Cond: (a2.aid = a1.aid) -> Parallel Seq Scan on a2 (cost=0.00..2228.24 rows=58824 width=97) -> Parallel Hash (cost=5265.29..5265.29 rows=29412 width=97) -> Parallel Seq Scan on a1 (cost=2890.00..5265.29 rows=29412 width=97) Filter: (NOT (hashed SubPlan 1)) SubPlan 1 -> Seq Scan on a3 (cost=0.00..2640.00 rows=100000 width=4) (10 rows) test=# create index a1_idx on a1 (aid); CREATE INDEX test=# create index a2_idx on a2 (aid); CREATE INDEX test=# create index a3_idx on a3 (aid); CREATE INDEX test=# explain select * from a1 inner join a2 on a1.aid = a2.aid where a1.aid not in ( select aid from a3 ); QUERY PLAN ---------------------------------------------------------------------------------- Merge Join (cost=2890.59..12509.32 rows=50000 width=194) Merge Cond: (a1.aid = a2.aid) -> Index Scan using a1_idx on a1 (cost=2890.29..7387.29 rows=50000 width=97) Filter: (NOT (hashed SubPlan 1)) SubPlan 1 -> Seq Scan on a3 (cost=0.00..2640.00 rows=100000 width=4) -> Index Scan using a2_idx on a2 (cost=0.29..4247.29 rows=100000 width=97) (7 rows)
ну так и не стало значительно быстрее :) запуск на ssd - без индексов 160ms, с - 105ms. Хочу миллисекунду
test=# select '1 millisecond'::interval; interval -------------- 00:00:00.001 (1 row)
Обсуждают сегодня