OpenTelemetry
Если я сделаю партицию на каждый час, то сильно больно будет?
Проблема в том, что хочется искать по trace_id, а он генерируется случайно.
Тут два варианта вижу: либо заставить trace_id генерировать так, чтобы он рос со временем (типа UUIDv6) и делать его ключом сортировки, либо делать маленькие партиции и индекс по trace_id (но с другим ключом сортировки)
можно и так отсортировать
в чем проблема отсортировать по trace_id?
оно не будет постоянно в фоне пересортировывать? слышал что сортировать по рандому не оптимально
вы неправильно услышали, и вообще нет пересортировок
А вы смотрели на примеры схем которые уже есть? https://github.com/jaegertracing/jaeger-clickhouse
смотрел, ещё у uptrace смотрел смущает что выбраны разные подходы
подскажите, пожалуйста, где про это почитать/посмотреть ну или хотя бы ключевые слова для поиска хочу разобраться (наверное я пересортировку спутал с мержем партов)
при инсерте записи сортируются в памяти, пишутся на диск, мержи просто идут по отсортированным наборам и делают сюрприз мерж
Обсуждают сегодня