~50B строк (поле device_ip имеет кардинальность ~100M), 128Gb RAM, memory_limit 200GB, external_group_by 100Gb
Например надо посчитать например такой запрос. Как это сделать? Сейчас не хватает памяти, причем не на этапе чтения данных а уже после него (память медленно растет до какого-то предела, потом стоит некоторое время, потом резко пытается выжрать кратное кол-во)
В принципе устраивает вариант выделить 30-40% ресурсов ноды и оставить запрос "считаться" на долгое время(чтобы дампил все лишнее на диск), тогда каким образом надо задать эти параметры?
Думаю он пытается собрать результат подселекта в памяти. Для этого ему требуется 100 (миллионов девайсов) * 24 (часов) * 30 (дней) * 8 (байт на один count) = 576 gigabytes
Обсуждают сегодня