172 похожих чатов

Добрый день, можете пожалуйста помочь с индексами. Есть большая таблица (гигов

на 300).
Выборка всегда делается в первую очередь по столбцу с датой (timestamp with timezone), но в выборке всегда есть ограничения по integer и boolean столбцам.
Причем обычно поиск нужен по последнему миллиону записей.
Сейчас выборка работает очень медленно.
Какой лучше построить индекс?
Я не совсем разобрался на сколько хорошо работает индекс по дате в Posgresql. Поэтому не знаю, лучше в составной индекс дату в начало засунуть c сортировкой DESC или сначала булево, потом число, потом дату в конце?

12 ответов

10 просмотров

Зависит от селективности условий в первую очередь. То есть по дате отфильтруется миллион записей, ладно. А сколько — по инт и булеан? А от скольки? А есть ли разница в относительном количестве — сначала по цэлому или сначала по дате?

И суть фильтра по дате уточните. Спрашивают с фильтром "за последний год" или именно миллион последних, т.е. если мало подходит под фильтры, до докопает до начала таблицы?

Ilya Anfimov
Зависит от селективности условий в первую очередь....

По инту и по булеву выборка десятки миллионов, у них селективность сильно ниже даты. Но когда остается миллион по дате, фильтры по инту и булеву отрезают больше половины данных. Просто как написал, не совсем понял как строится индекс по полной дате со временем и миллисекундами с таймстампом. Лучше булевым и интами отрезать 2/3 из десятков миллионов записей и остатки фильтрануть по дате или дата как то хитро индексируется и он быстро отрежет лям нужных записей, а уже их обработать доп фильтрами. Как будет быстрее?

alex che
И суть фильтра по дате уточните. Спрашивают с филь...

Там всегда период, просто период относится обычно к последним месяцам. Ну то есть за последний месяц 20 млн записей, а в выборке нужно за 2 недели с начала месяца, типа того.

Константин Коломейцев ☭
По инту и по булеву выборка десятки миллионов, у н...

А много там разных значений инта в запросе? (Булевого понятно что немного).

Константин Коломейцев ☭
По инту и по булеву выборка десятки миллионов, у н...

Просто если одно — то ответ очевиден — инт, бул, дата. Если много — то думать надо. И да, в индэксе по дате нет ничего особенного. Число как число, смысл только спецыфический.

Ilya Anfimov
Просто если одно — то ответ очевиден — инт, бул, д...

Во, спасибо, это и хотел услышать, тогда получается bool, int, date DESC ?

Константин Коломейцев ☭
Около 20

Если дата как timestamptz — то пожалуй всё равно инт, бул, дата. А если как день — то можэт и нет. Как минимум если на хдд, то можно подумать и про наоборот — дата, бул, инт. На ссд скорее всё равно будет. Впрочем, судя по всему, результаты для всех вариантов будут сопоставимыми.

Ilya Anfimov
Если дата как timestamptz — то пожалуй всё равно и...

Благодарю, Вы сильно помогли! Там timestamptz с миллисекундами ещё, поэтому немного ступор был, везде советуют по дате, а Я не мог понять как она хитро индексируется, чтобы выборку срезать. Там же миллисекунды и каждая дата почти уникальна, это как по id составной индекс строить, он всё равно всё обойдет

Константин Коломейцев ☭
Во, спасибо, это и хотел услышать, тогда получаетс...

Ещё периодически встречаюсь с тем, что постгрес как-то не всегда нормально воспринимает несвязанные диапазоны — иношда приходится в подзапросы переделывать.

Похожие вопросы

Обсуждают сегодня

Anyone here suffers from unexplained aural migraines, who would be up for talking for a bit? Doesn't *have* to be aural, but I am not asking about headaches, I mean actual mi...
Martin Rys
55
Всем здравствуйте!) У меня такой вопрос. Есть два роута, роут1 и роут2. Они связаны с очередью some_queue. По задаче предполагается, что есть два паблиша. Паблиш1 отправляет...
Format
10
Вопрос по WIN32: Насколько я понимаю то все функции win32 привязаны к объектам операционной системы. Например консоль, файл, кисть, окна итд. Следовательно функции win32 упра...
Tommy Vercetti
6
Hello, can I install macOS and run flutter on a virtual machine? Is it possible to print for iphone?
Mazones
11
кто-то пользуется компонентами rx ? как их лучше ставить, через OPM? (lazarus)
Iluha Companets
15
Дороу! У кого-нибудь есть в загашнике проверенная функция экранирования, аналог re.escape в Python? Из доки: » Escape all the characters in pattern except ASCII letters and n...
Daniil Smolyakov
9
подскажите пожалуйста, как мне освободить результат записанный в переменную result? в чем проблема подскажите если МОЖЕТЕ?
Михаил Helper
28
В смысле более затратная? Общая стоимость владения лошадью меньше, чем автомобиля. В среднем.
Sergej R
10
есть тут кто-то , кто только начал изучать си? если проходите курс на степике или как-то сами изучаете, пишите, может, скооперируемся?..
Eule
25
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Карта сайта