184 похожих чатов

Коллеги, я хочу положить в кликхаус структурированный лог событий с

наших серверов. Всего сейчас около 200 разных типов событий. Какие-то поля пересекаются, какие-то уникальны для определенных событий.

Если убрать все пересечения и просто посмотреть по типам данных, то около 40 колонок хватит.

Если хранить каждое поле евента в своей колонке, так чтобы не было использования одной колонки под разные поля разных событий, то это около 2000 колонок.

Ощущение, что имеет смысл их склеивать и воспринимать их просто как: 3-я колонка с интом, 6-я колонка со строкой и каждое событие раскладывать по этим колонкам, храня реальный маппинг евентов в стороне.


Проблема в том, что маппинг может меняться. Хочется в саму базу положить сам маппинг, который мы увидели и потом проверять: поменялся он или нет.

Это толковая идея или фигня какая-то придумалась?

6 ответов

5 просмотров

я бы сделал x пересекающихся колонок + колонки K/V сгруппировав по типам userAttributesNames Array(String) , userAttributesValues Array(String) DeviceAttrNames Array(String) , DeviceAttrHWValues Array(String), DeviceAttrSoftwareValues Array(String) не кладите все аттрибуты в 2 колонки, они станут супертяжелыми для чтения с диска, лучше больше колонок, но в итоге чтобы колонок было меньше 500(1000) читать такие поля можно с помощью Array Join , и arrayFilter select arrayFilter((v, k) -> k = 'a', values, keys) a from (select ['a','a','b','a'] keys, [1,2,3,4] values) ┌─a───────┐ │ [1,2,4] │ └─────────┘

Maksim-Lapshin Автор вопроса
Denny [Altinity]
я бы сделал x пересекающихся колонок + колонки K/...

т.е. вы рекомендуете редкие и малопересекающиеся поля редко встречающихся евентов сложить в хвостовые array(int) + array(string) колонки?

Maksim-Lapshin Автор вопроса
Denny [Altinity]
да

спасибо!

Maksim Lapshin
спасибо!

почитайте https://clickhouse.tech/docs/ru/sql-reference/data-types/nested-data-structures/nested/ для уложения модели в голове самим Nested я не пользуюсь, это бессмысленны сахар для create table. дальше там массивы хранятся, у полей просто точка в имени.

Maksim-Lapshin Автор вопроса

Похожие вопросы

Обсуждают сегодня

Если у меня есть такой класс: Object = {} function Object:new(a_name, a_transform, a_color, a_mesh, a_material, a_shader, a_textures) local private = {} private.n...
Cuarno Vile
4
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
зачем же переименовывать ? чтобы кол-во участников возросло или вдруг IBM от этого снова на свифте начнет кодить ? Я не понимаю что страшного в том что свифт гавно, если это т...
Oleh Nerzh
10
здравствуйте. совершаю вот такую вещь: strcpy(line, (char)current_number); где current number — неподписанный шорт, line — массив чаров. ругань следующая: main.c:29:30: error...
Roberto's Ширгозиев
13
@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
@NikaBelurgHR Бот? Ассемблер?
КТ315
11
юзеры Jetpack Compose тут?
Qtless Qtless
7
Добрый день! Подскажите, пожалуйста: какими компетенциями нужно обладать, чтобы претендовать на работу эрланг (отдельная благодарность, если про элексир тоже подскажете) разр...
via ☸️ led
20
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Карта сайта