распределенными таблицами?
надо построить сложный отчет, где вычисления сохраняются в промежуточные таблицы.
есть источник данных, который хранится на шардах и распределенная таблица над ними
на первых шагах хочу сделать сделать группировку, кажется логичным оставить результаты там, где они вычислялись
т.е. я создаю таблицы для результата на шардах и распределенную для них. потом я инсерчу в распределенную таблицу
для результата запрос над распределнной таблицей-источником. правильно ли это? время выполнения такого запроса раза в два
больше, чем я отдельно посчитаю кусочек на шарде (результирующий объем десятки миллионов строк на каждый кусок), что собственно и смущает.
спасибо)
Данные по произвольному ключу распределены?
Обсуждают сегодня