понял имеет смысл это делать когда происходит group by sharding key, но тогда если выбирать за ключ шардирования не первичный ключ - это создаёт неравномерную нагрузку на этапе фильтрации, или тут решается блум индексами мб?
ээээ нет. Шардинг key не учитывается при оптимизации запросов (по дефолту) все шарды получают один и тот же запрос и выполняют его по своему primarykey/orderby (да он может быть разный на шардах, если хочется извращений)
Я имел ввиду что если я буду делать group by не по шардированному ключу, то на инициаторе получатся дупликаты, верно жеж?
да, поэтому используйте optimize_distributed_group_by_sharding_key
Обсуждают сегодня