но тем не менее весит 786.82 MiB в сжатом виде. Расскажите плиз про реализацию, почему уменно так?
Потому что в КХ нет пустых колонок. В них хранится значение по умолчанию для типа. А если она nullable, то рядом ещё хранится файл с признаком null или нет
в КХ не бывает пустых колонок, там всегда значение по умолчанию, и даже null хранится как один байт, 1 / 0 mrk файл тоже не сжат например, он хранит 3 штуки UInt64 на каждую гранулу. 100000000000/8192*3/1024/1024 = 35MB = mrk2 На самом деле шутка в том, что если добавить столбец в таблицу то он не будет занимать ничего. Его просто не будет в старых партах. Есть тикет про то что если весь столбец в парте равен значению по умолчанию, то не нужно его хранить в парте. И если вы думаете что можно сделать как в оракле , типа Null-ы во всех trailing столбцах не занимают место, то нет так нельзя. В столбце надо понимать где начинается следующая строка внутри столбца. CODEC delta, ZSTD помогут сократить
Обсуждают сегодня