полей на каждую запись. Если делать на каждое поле свой столбец, их получится миллион, из которых будет заполнен 1%. Неэффективно.
                  
                  
                  Вместо этого рассматриваем вариант хранения словарей в столбцах (говорят, так можно?). Но со словарями возникает проблема множественного дублирования заголовков. Т.е. тоже не суперэффективно получается.
                  
                  
                  Другой вариант - хранить массивы без заголовков, а в отдельной таблице держать наименования столбцов. Но даже от типа события поля могут варьироваться. 
                  
                  
                  В общем, мы в раздумьях. Подскажите, пожалуйста, какой вариант для хранения таких данных вы бы посоветовали? Может, вообще какой-то другой?
                  
                  
                
Словари, а Заголовки хранить enumом?
речь про nested ? про массивы? Что в массивах (keys Array(String) , values Array(String)) повторяются keys ? LowCardinality решает эту проблему. (keys Array(LowCardinality(String)) , values Array(String)) и понятно что хранить key числом эффективнее и расшифровывать через external dictionary. enam не очень удобен, когда надо его расширять постоянно из-за появления новых key.
Обсуждают сегодня