Исходя из ваших комментариев, получается, что чтобы получить марты в

Sergey Platonov
Если данные из PG, то почему в нем же денормализац...

Если данные из PG, то почему в нем же денормализацию и не сделать?

0

13.11.2023

unhingedlunatic Автор вопроса

Пока что по двум причинам: 1) в PG у меня доступ только к реплике без возможности создания/изменения там чего-либо 2) в PG все эти джойны и группировки долго выполняются. Я тоже до этого читал, что CH не любит джойны и т.д., но на менее мощном железе CH все эти джойны делает быстрее, чем PG Я все еще ищу какой-то более оптимальный способ для организации всего этого, опыта особо нет в проектировании где и на каком этапе лучше делать обработку, поэтому буду благодарен за любые советы 😊 Думаю это частая задача, когда из нормализованной OLTP в CH нужно перенести вьюшки.

0

13.11.2023

unhingedlunatic
Пока что по двум причинам: 1) в PG у меня доступ т...

ну так сделайте к этой ПГ еще одну реплику ПГ :)) и делайте в ней что хотите )) в КХ можно совмещать миллионы записей и джойны, но для этого надо кропотливо работать Где-то словари, где-то сортировки и первичные ключи, где-то предагрегации бездумно поджойнить - это ПГ

0

13.11.2023

unhingedlunatic Автор вопроса

Sergey Platonov
ну так сделайте к этой ПГ еще одну реплику ПГ :)) ...

еще одна причина) в CH таблицы весят гораздо меньше, в PG у меня нет столько памяти все это хранить >бездумно поджойнить - это ПГ у меня как раз бездумные джойн получаются быстрее более-менее осмысленных в PG)

0

13.11.2023

unhingedlunatic Автор вопроса

Sergey Platonov
ну так сделайте к этой ПГ еще одну реплику ПГ :)) ...

а если я в CH на таблицы наложу ORDER BY на колонки, по которым идет джойн - станет быстрее?

0

13.11.2023

unhingedlunatic
а если я в CH на таблицы наложу ORDER BY на колонк...

нет, КХ не использует индексы и orderby для join

0

13.11.2023

unhingedlunatic
а если я в CH на таблицы наложу ORDER BY на колонк...

ненене - тут нету ответов из 2-3 пунктов )

0

13.11.2023

unhingedlunatic Автор вопроса

Denny [Altinity]
нет, КХ не использует индексы и orderby для join

а PRIMARY KEY?)

0

13.11.2023

Ανδρυχα ι κυκυχα

Denny [Altinity]
нет, КХ не использует индексы и orderby для join

то есть они чисто для селектов?!

0

13.11.2023

unhingedlunatic
а PRIMARY KEY?)

под индексом я подразумевал primary key

0

13.11.2023

Ανδρυχα ι κυκυχα
то есть они чисто для селектов?!

типа да. Но вообще в первую очередь они нужны чтобы данные сохранить, пожать и помержить

0

13.11.2023

unhingedlunatic Автор вопроса

Denny [Altinity]
под индексом я подразумевал primary key

SELECT -- для простоты напишу просто все поля из всех таблиц -- но по факту прописываю отдельно все 60 полей в селекте isr.* , cal.* , d.* , dr.* , dd.* -- таблица фактов 170 млн.строк FROM int_so_regions AS isr -- справочник-календарь на 2132 строк LEFT JOIN dim_calendar AS cal ON isr."date_report" = cal."date" -- справочник препаратов на 440596 строк LEFT JOIN dim_drug_so AS d ON isr."drug_id" = d."id" -- справочник регионов на 87 строк LEFT JOIN dictionary_region AS dr ON isr.region_id = dr.id -- справочник округов на 12 строк LEFT JOIN dictionary_district AS dd ON dr.district_id = dd.id т.е. если я сделаю все поля для джойнов как PRIMARY KEY скорость должна увеличиться? или это фиговая практика, накладывать PRIMARY KEY только для ускорения джойнов?

0

13.11.2023

unhingedlunatic
SELECT -- для простоты напишу просто все поля из ...

не увеличится

0

13.11.2023

unhingedlunatic Автор вопроса

мне сказали, что справочник на 440596 строк не залезет в словарь

0

13.11.2023

unhingedlunatic
мне сказали, что справочник на 440596 строк не зал...

Ну сожрет мегабайт 500

0

13.11.2023

unhingedlunatic Автор вопроса

Dmitry [Altinity] Titov
Ну сожрет мегабайт 500

500 звучит немного) а в моем понимании словарь - это ключ-значение...а если мне из словаря надо для одного ключа получить 30 значений (разных колонок)?

0

13.11.2023

unhingedlunatic
500 звучит немного) а в моем понимании словарь - э...

Да нормально, ток используйте HASHED_ARRAYS лайоут, он как раз для такого подойдет

0

13.11.2023

unhingedlunatic
500 звучит немного) а в моем понимании словарь - э...

30 раз напишите getDict

0

13.11.2023

unhingedlunatic Автор вопроса

Sergey Platonov
30 раз напишите getDict

Стикер

0

13.11.2023

Sergey Platonov
30 раз напишите getDict

Не обязательно, словари имеют спец оптимизацию для join, И кстати dictGet может возвращать несколько аттрибутов как тапл

0

13.11.2023

Dmitry [Altinity] Titov
Не обязательно, словари имеют спец оптимизацию для...

ну вот ваш коллега рекомендовал все же getDict

0

13.11.2023

Sergey Platonov
ну вот ваш коллега рекомендовал все же getDict

Поэтому стоит попробовать и то и то Для тапла синтакс как то так выглядит dictGet(name, 'col_1, col_2', ..)

0

13.11.2023

Sergey Platonov
ну вот ваш коллега рекомендовал все же getDict

потому что join со словорем автоматически транслируется в dictGet только если ключ словаря UInt64 и надо еше join_algorithm поставить=direct

0

13.11.2023

Dmitry [Altinity] Titov
Поэтому стоит попробовать и то и то Для тапла синт...

я получил то на то а так как набор гетов уже написал, то так и оставил :))

0

13.11.2023

Denny [Altinity]
потому что join со словорем автоматически транслир...

как бы это прихранить 🙂

0

13.11.2023

Alexey Sokolov

Denny [Altinity]
потому что join со словорем автоматически транслир...

А это в какой версии появилось? Или изначально так было? Вроде бы раньше писали, что обращение к словарю без словарных функций типа dictGet/dictHas - это только для отладки.

0

13.11.2023

Sergey Platonov
я получил то на то а так как набор гетов уже напис...

Там была проблема в том, что один дикт гет достает за один раз а 30 дикт гет выполняется 30 раз, но вроде это хотели оптимизировать, но не помню статус этой хотелки

0

13.11.2023

Dmitry [Altinity] Titov
Там была проблема в том, что один дикт гет достает...

на данный момент 30 точно работает дольше, чем 1 🙂

0

13.11.2023

Alexey Sokolov
А это в какой версии появилось? Или изначально так...

в 20... что-то там я потому и рекомендую dictGet потому что вы никогда не узнаете что оно перестало работать, ну будете запросы переписывать после апгрейда. т.е. оно работало, потом перестало, потом стало работать если =direct

0

13.11.2023

Dmitry [Altinity] Titov
Там была проблема в том, что один дикт гет достает...

ну hashedArray оптимизирован под tuple, в хештаблицу один раз сходит

0

13.11.2023