из 3х нод - 3 шарда без реплик (пока)
Запускается запрос удаления данных из distribute таблицы (alter table ... on cluster '{cluster}' delete where ........)
Случилось следующее, мутация шла очень долго и я решил её прервать. kill mutation where ...
Мутация удалена, в процессах ни на сервере где был запрос, ни на соседних нодах нет его в процессах и в активных мутациях
НО оперативная память на сервере где был запущен процесс не освободилась. Пробовал посмотреть запросами (https://kb.altinity.com/altinity-kb-setup-and-maintenance/altinity-kb-who-ate-my-memory/) кто "кушает память" - никто... Но память при этом занята процессами clickhouse и выедена вся (под 60 ГБ)
Проблема решилась только перезапуском сервера на котором запускал запрос.
Не встречали такое поведение, может есть открытые баги (я не находил)?
память то какая была занята? RSS или Page Cache?
RSS насколько я знаю.
ну, тут все таки надо уточнить и графики показать... заодно понять как метрики снимались... SELECT event_time, formatReadableSize(CurrentMetric_MemoryTracking) , formatReadableSize(CurrentMetric_MergesMutationsMemoryTracking) FROM system.metric_log WHERE event_date='YYYY-MM-DD' AND event_time BETWEEN 'YYYY-MM-DD HH:MI:SS` AND 'YYYY-MM-DD HH:MI:SS`; и сравнить с SELECT event_time, formatReadableSize(value) AS RSS FROM system.asynchronous_metric_log WHERE metric='MemoryResident' AND event_date='YYYY-MM-DD' AND event_time BETWEEN 'YYYY-MM-DD HH:MI:SS` AND 'YYYY-MM-DD HH:MI:SS`;
Обсуждают сегодня