В каком виде идентификатор?
столбец с уникальными значениями для каждого пользователя, который повторяется на каждом ивенте
Если пользователей не очень много (тысячи, не миллионы), то попробуйте LowCardinality(String)
Различных значений более 20 миллионов :(
Ну тут либо конвертировать в числовое представление, если возможно и пробовать кодеки типа T64 DoubleDelta(если сортировка по пользователю), либо применять общую компрессию (LZ4,ZSTD). Либо все вместе. Нужно экспериментировать, в том числе с LowCardinality.
Да, я этим уже и занимаюсь :)
а зачем хранить их как строки? числа гораздо эффективней и для запросов и для хранения
Ну потому что это комбинация чисел и букв
Обсуждают сегодня