a = 1 and b = 'text';
2 вопроса:
1. Хочется понять, как я могу улучшить кардинальность строк в ответе? create statistics on a, b, c как-то не особо помогает.
2. В create statistics как-то можно влиять на ко-во сохраняемых данных? (что-то типо default_statistics_target для MCV в create statistics)?
1. По идее, именно так, да. А Вы точно выполнили ANALYZE после CREATE STATISTICS? 2. Да, тот же параметр. Ну и ALTER STATISTICS name SET STATISTICS new_target;. > Странно-то как, мне даже индекс на on table (c) where a = 1 and b= 'text'; не помогает со статистикой Эти вообще не помогают, к сожалению. :(
Да, analyze выполнил.
> Эти вообще не помогают, к сожалению Помню, что можно было строить индекс и тогда по индексу отдельно собирается статистика. Возможно не по любому индексу.
Тогда, по идее (могу врать), статистика иcпользуется для оценки селективности where a = 1 and b = 'text', и потом n_distinct для "c" используется для вычисления общей селективности.
Только по функциональным, опять-таки (а жаль, жаль).
И они, видимо, перемножаются, так? И получается, что можно было статистику строить по двум стобцам, вместо 3-ёх
Как именно это рассчитывается, зависит от знака значения n_distinct (см. документацию), но общая идея такая, да. Но лучше Вы проверьте это — я могу ошибаться / точно не помню.
Кстати, про это: https://dbfiddle.uk/?rdbms=postgres_13&fiddle=7bc47667ce573c0c76f93ffe9755498e Мне лично кажется, что было бы неплохо, если бы кто-то придумал, как это исправить улучшить (проблема тут в том, я так понимаю, что далеко не все типы индексов "знают", сколько tuples индексировано).
> ALTER STATISTICS name SET STATISTICS new_target;. Как же это неочевидно, что нельзя сразу задать.
И, кстати (из https://www.postgresql.org/docs/current/catalog-pg-statistic.html ): pg_statistic also stores statistical data about the values of index expressions. These are described as if they were actual data columns; in particular, starelid references the index. No entry is made for an ordinary non-expression index column, however, since it would be redundant with the entry for the underlying table column. Currently, entries for index expressions always have stainherit = false.
Обсуждают сегодня