полей на каждую запись. Если делать на каждое поле свой столбец, их получится миллион, из которых будет заполнен 1%. Неэффективно.
Вместо этого рассматриваем вариант хранения словарей в столбцах (говорят, так можно?). Но со словарями возникает проблема множественного дублирования заголовков. Т.е. тоже не суперэффективно получается.
Другой вариант - хранить массивы без заголовков, а в отдельной таблице держать наименования столбцов. Но даже от типа события поля могут варьироваться.
В общем, мы в раздумьях. Подскажите, пожалуйста, какой вариант для хранения таких данных вы бы посоветовали? Может, вообще какой-то другой?
Словари, а Заголовки хранить enumом?
речь про nested ? про массивы? Что в массивах (keys Array(String) , values Array(String)) повторяются keys ? LowCardinality решает эту проблему. (keys Array(LowCardinality(String)) , values Array(String)) и понятно что хранить key числом эффективнее и расшифровывать через external dictionary. enam не очень удобен, когда надо его расширять постоянно из-за появления новых key.
Обсуждают сегодня