агрегатами?
Контекст: в официальной документации YC указано, что шардирование ускоряет выполнение запросов. Однако вместо кратного ускорения на боевых данных я получил только 10% для 2-х шардов.
ну в среднем случае ускоряет. (select sum(col) from distrtable). а если у вас аггрегат типа median, groupArray - который имеет гигантский стейт - замедлит. если у вас подзапросы возвращают все строки (только фильтруют чуток без аггрегаций) - замедлит, так как результат шлется на инициатор и ещё много разных "если" может быть
Большое спасибо. В моём случае очень много argMax по дате-времени действия с ключом на ~20 столбцов.
вы шардировали по какому ключу?
Хороший вопрос, спасибо. Тоже проверю.
Обычно хороший результат дает шардирование по высоко кардинальному ключу из GROUP BY в таком случае на каждом шарде стейт будет меньше в N (число шардов) раз, те быстрее
Обсуждают сегодня