ответ.
Есть три строчки:
'A',{100,101}
'B',{102}
'A',{103}
Нужно написать запрос таким образом чтобы стало
'A',{100,101,103}
'B',{102}
Можно конечно по каждому ID (букве) сначала раскрыть, массив через unnest, а потом снова сгруппировать через array_agg. https://www.db-fiddle.com/f/eRBhTyR4JjBfSv59zbXRqF/0
Но хотелось бы сделать тоже ввиде одной групповой функции совмещающей array_agg и array_cat.
Может кто подскажет название или на статейку ссылку даст как такую создать?
Всем заранее спасибо 🙏🏻
Группировка не работает?
а почему просто array_cat не годится?
какой агрегатной функцией? sum () пробовал не работает, по отдельности array_agg и array_cat, тоже.
Query Error: error: function array_cat(integer[]) does not exist https://www.db-fiddle.com/f/cka73xSEyPCE3G213wy5ot/0
Извините, я был не прав. Не знаю как сделать, кроме как через unnest
Решил отвлечься от суровой реальности, написал такое: https://www.db-fiddle.com/f/eRBhTyR4JjBfSv59zbXRqF/1 Это если уж очень хотите сделать без подзапроса, хотя не вижу нем ничего плохого.
Благодарю, это то что я ожидал в запросе. Агрегатная функция тоже понятная, спасибо за ваш пример. Жаль что в PG нет такого варианта встроенного. Интересны еще замеры по производительности, что лучше unnest + Array_agg, или вариант с агрегатной функцией через селект, если в исходных данных 1 млн записей, а ключей около 50к. Попробую завтра устроить такое тестирование.
Агрегатную функцию можно обвешать дополнительными атрибутами типа IMMUTABLE или RETURNS NULL ON NULL INPUT, я не стал с этим заморачиваться О результатах замера прошу в личку отписать, самому очень интересно, какой вариант лучше.
RETURNS NULL ON NULL INPUT — это неправда, не надо так говорить IMMUTABLE не ускорит при использовании в качестве агрегатной функции, т.к. агрументы каждый вызов другие
По поводу NULL, думаю, зависит от конкретной задачи, а IMMUTABLE стоит пометить хотя бы для общей информации, т.к. функция может использоваться и в другом месте, например. Впрочем, не готов вести споры в 2 часа ночи.
Обсуждают сегодня