строк в таблице из двух столбцов.
Ожидается порядка 10 млн уникальных.
Для одного столбца понятно, что countrows(values()) лучше, чем distinctcount(). А для двух, трех...?
Если у кого-то есть ответ с оптимальным решением, дайте знать 😅
COUNTROWS ( DISTINCT ( SELECTCOLUMNS
Или COUNTROWS ( SUMMARIZE(
А кроме 💩 других аргументов вы не приведете?
я? вы бросьте это в график по датам и увидите куда вас система пошлет с вашим расчетом уникумов) на сек 10 лямов уникумов это под пол лярда строк или более
А ваш вариант какой?
Зачем и где это должно быть?
а мой вариант математический и на моих данных это более 5 раз шустрее. но как считать, уж извольте придумать сами
Юрий, а вот у меня вопрос "глупый "- но все же...если мы знаем ,что нам нужно считать уников на большом кол-ве строк - почему не делать это на стороне DB?
вполне не глупый, если требуется расчет с определенной гранулярностью, то почему не делать предрасчет и не грузить его в модель готовым, вариантов решения масса, все зависит от цели и анализа
Обсуждают сегодня