потому что можно получить жесткий байас в запросах. Ну, например, если сделать сэмплировпние по имени события - оно вырежет какие-то события из рассмотрения вообще, и запросы вида select uniqExact(event_name) from events where user_id = x sample 0.1 будут возвращать глупости. Можете попробовать завести сэмплирование по uuid (предполагаю, что это уникальный ключ события, что-то вроде уникального id).
А вообще говоря, на пользователя много событий приходится? Может, зря приседаете?
Записей на user_id много, в каждом запросе еще event_name указывается по типу WHERE user_id = 1 AND event_name = 'pickup'
Обсуждают сегодня