меня есть таблица с просмотрами страниц, ключ сэмплирования - sipHash64(user_id).
Если я сделаю SAMPLE 0.1 - я получу все данные по десятой части user_id? Или часть данных по 10% user_id?
То есть по сути это аналог global in (
SELECT user_id
FROM table
SAMPLE 0.1
WHERE dt …) ?
Апну вопрос :)
Еще раз апну вопрос. Прочитал статью про сэмплирование (http://www.3manuek.com/clickhousesample), но конкретно на свой вопрос ответа не нашел.
И еще разок *____* Может кто-то знает?
Не очень понятна разница между "все данные по десятой части user_id" и "часть данных по 10% user_id"
Обсуждают сегодня