>> Вы же не сравнивали, сознайтесь? 😉 Изначально таблицы не были

Question

>> Вы же не сравнивали, сознайтесь? 😉 Изначально таблицы не были

партицированы, и в течении какого-то времени скорость выполнения запросов проседала, в какой-то момент до неприемлемого уровня. Партицирование ввел всего для 3х таблиц и это дало серьезный буст производительности - от индексов такого получить не удалось. Пруфов предоставить прямо сейчас не могу, т.к. нужно искать и разворачивать где-нибуть старый дамп бд + найти свободную машину, но то, что partition pruning работает на моих запросах с ограничением по диапазону времени уверен. Суммарный объем записей около 120млн на таблицу, на партишен за последнее время около 1.3млн, так что партицирование позволяет даже без индексов сузить диапазон с 120млн до 5млн для большинства запросов, и мне кажется это неплохой результат.

>> возможно, стоило подумать, какой "физический" порядок записей лучше подходит для большинства запросов и сделать CLUSTER

Насколько я понял документацию, в postgresql нет clustered table, а операция cluster выполняет одноразовое упорядочивание данных в таблице. Я могу сказать, что практически все запросы к этим таблицам запрашивают данные за последние 3-4 недели/месяца - а обновляются как раз в основном данные за 3-4 последних месяца.

Пойду курить pg_partman, спасибо

ps. c tl;dr промазал, бывает

#backend #devops #pgsql #programming #russian

0

20.11.2019

1 ответов

29 просмотров

Yaroslav Schekin · Accepted Answer

> Партицирование ввел всего для 3х таблиц и это дало серьезный буст производительности - от индексов такого получить не удалось. Кхе-кхе, возможно, Вам не удалось? ;) Ладно, это, вполне возможно, всего лишь придирки — Вам "на месте" оно виднее, конечно. > но то, что partition pruning работает на моих запросах с ограничением по диапазону времени уверен. Вопрос не в том, работает он или нет, и в том, насколько он хорош по сравнению и индексацией. Ладно, это "лирика". Сделали, стало лучше — и хорошо. :) > Насколько я понял документацию, в postgresql нет clustered table, Да. > а операция cluster выполняет одноразовое упорядочивание данных в таблице. И да. Но то-то и оно — Вы что, собираетесь менять (а если, собираетесь — насколько часто?) "старые" данные? ;) > Я могу сказать, что практически все запросы к этим таблицам запрашивают данные за последние 3-4 недели/месяца - а обновляются как раз в основном данные за 3-4 последних месяца. Да, для этих таблиц нужно смотреть на autovacuum, конечно, а не всякие там CLUSTER и т.п.

172 похожих чатов

>> Вы же не сравнивали, сознайтесь? 😉 Изначально таблицы не были

1 ответов

Похожие вопросы