партицированы, и в течении какого-то времени скорость выполнения запросов проседала, в какой-то момент до неприемлемого уровня. Партицирование ввел всего для 3х таблиц и это дало серьезный буст производительности - от индексов такого получить не удалось. Пруфов предоставить прямо сейчас не могу, т.к. нужно искать и разворачивать где-нибуть старый дамп бд + найти свободную машину, но то, что partition pruning работает на моих запросах с ограничением по диапазону времени уверен. Суммарный объем записей около 120млн на таблицу, на партишен за последнее время около 1.3млн, так что партицирование позволяет даже без индексов сузить диапазон с 120млн до 5млн для большинства запросов, и мне кажется это неплохой результат.
>> возможно, стоило подумать, какой "физический" порядок записей лучше подходит для большинства запросов и сделать CLUSTER
Насколько я понял документацию, в postgresql нет clustered table, а операция cluster выполняет одноразовое упорядочивание данных в таблице. Я могу сказать, что практически все запросы к этим таблицам запрашивают данные за последние 3-4 недели/месяца - а обновляются как раз в основном данные за 3-4 последних месяца.
Пойду курить pg_partman, спасибо
ps. c tl;dr промазал, бывает
> Партицирование ввел всего для 3х таблиц и это дало серьезный буст производительности - от индексов такого получить не удалось. Кхе-кхе, возможно, Вам не удалось? ;) Ладно, это, вполне возможно, всего лишь придирки — Вам "на месте" оно виднее, конечно. > но то, что partition pruning работает на моих запросах с ограничением по диапазону времени уверен. Вопрос не в том, работает он или нет, и в том, насколько он хорош по сравнению и индексацией. Ладно, это "лирика". Сделали, стало лучше — и хорошо. :) > Насколько я понял документацию, в postgresql нет clustered table, Да. > а операция cluster выполняет одноразовое упорядочивание данных в таблице. И да. Но то-то и оно — Вы что, собираетесь менять (а если, собираетесь — насколько часто?) "старые" данные? ;) > Я могу сказать, что практически все запросы к этим таблицам запрашивают данные за последние 3-4 недели/месяца - а обновляются как раз в основном данные за 3-4 последних месяца. Да, для этих таблиц нужно смотреть на autovacuum, конечно, а не всякие там CLUSTER и т.п.
Обсуждают сегодня