можно добавить, если его нет или это из разряда фантастики?
https://clickhouse.tech/docs/en/sql-reference/statements/alter/sample-by/ можно просто WHERE rand() % 10 = 1 сделать
sampling key просто выражение, оно на лету при чтении вычисляется выражение sampling key должно вычисляться на основе полей в primary key и вычисляется соответсвенно для гранул и позволяет быстро фильтровать data parts при чтении
спасибо за хинт! вероятностный подход в моём случае не очень хорошо условно есть данные, которые заливаются каждую секунду и вероятностный подход будет брать нестабильные промежутки, в то время как самплинг более детерминирован - и условно при коэффициенте 0.1 будет выдавать каждую десятую секунду
это прочитал, но возможность самплинга нужно организовывать при создании таблицы... вот и поинтересовался, есть ли возможность в рантайме именно включить эту возможность..
есть, но ограничено полями которые присутствуют в ORDER BY \ PRIMARY KEY
sampling очень сложная тема. Надо ее планировать до создания таблицы. Проблема даже не в том какой индекс уже задан, проблема вообще понять какой индекс возможен чтобы и семплинг работал.
Обсуждают сегодня