случае с 500+ серверами в Яндек Метрике кластере, каждый Distributed запрос посетит все 500 серверов независимо от схемы шардирования - рандомно или по ключу user_id? Или все таки есть способ разграничить SELECTы?
в метрике обычно интересующие один select данные лежат на некотором подмножестве машин. на нем есть своя distributed таблица, в которую включена нужная часть кластера.
Обсуждают сегодня