проход.
Есть следующие таблицы (id - везде первичный ключ)
client - (id, name) - клиент
product - (id, product_namename)
catalog - (id, catalog_name)
catalog_product_mapping (id, product_id, catalog_id) - маппинг продуктов на каталоги. Продукт может принадлежать нескольким каталогам.
sale - (id, client_id, date). - продажа, У каждой продажи один клиент
sale_item - (id, sale_id, product_id, quantity, price) - элемент продажи
Нужно посчитать одним запросом:
общую сумму продаж,
сумму продаж за каждый день
сумму продаж каждого продукта
сумму продаж каждому клиенту
сумму продаж товаров из каждого каталога (не равна сумме всех прожаж так как товар может быть не в одном каталоге.)
Такая задача, насколько я понимаю, не решается без подзапросов никаким вариантом SUM с группировкой или окнами и решалась бы, если бы была функция SUM(DISTINCT sale_item.id value ), то есть функция, которая суммирует только значения sale_item один раз из каждой уникальной строки.
Вот если мы захотим получить количество записей sale_item, то мы можем это сделать с помощью COUNT(DISTINCT sale_item.id).
Можно подумать в сторону вычисления количества задвоенных записей с помощью того же COUNT() и делить суму на это количество, но какое-то совсем уж избыточное нагромождение получается.
Если все так и есть, как я думаю, то придется написать свою арегатную функцию SUM_DISTINCT со свойствами как описано выше.
Или общество знает как это сделать существующими средствами?
у вас классика граф, ltree и вперед. я только в прошлом году подобную задачу решал, не знаю насколько это будет работать на 1ккк записях но на 1кк работает шустро.
в вашем понимании одним запросом это должен быть один select или результат должен быть получен одним набором данных?
https://www.postgresqltutorial.com/postgresql-grouping-sets/
Обсуждают сегодня