вносится 1миллиард строк, где один колумн, это содержимое одной из этих 10000 строк, лучше вынести их в отдельную таблицу и дать им ID и вносить его или просто вносить их в таблицу и не париться?
есть такая штука -- LowCardinality, примерно для вашего случая
Да, я знаю про неё, просто боюсь, что потом 10 000 строк могут превратиться в 100 000
словарь в каждом парте свой
на самом деле решение можно принять только зная запросы которые будут выполняться над этой колонкой. И например джойн с таблицей на 100к это совсем не сахар. И словарь (ext.dictionary) тоже не сахар.
Join'ы делаться не будут, только если на несколько сотен строк
вы просто не понимаете что такое джойны. Вот например вы сохранили в большой таблице id = 777 В маленькой таблице у вас 100к строк, как вы расшифруете 777 в большой таблице? Вы сделаете джойн. Nested loop в КХ нету, HashJoin перекинет все 100к в память и будет делать это очень долго (100мс)
Вынесу данные, которые мне нужны в ENGINE = Memory() и там сделаю Join
Обсуждают сегодня