hive (200гб, 75 тб) и далее найти максимум по колонке. Попытки это сделать заканчиваются ошибкой нехватки памяти. Подскажите, возможно ли вообще это сделать? Если да, то в какую сторону копать?
кластер 8 нод (16 ядер, 128 гб на ноду). 4 тб памяти
может код запроса?
Объединение - join или union?
условно with tbl as (select id, attr1, attr2 from table1 union all select id, attr1, attr2 from table2 ) select max(attr1) from tbl;
Обсуждают сегодня