понять куда смотреть.
Есть таблица с TTL месяц, данных льется туда не мало, где-то 5-8 млрд строк за месяц (строки сами по себе объемные), и со временем я заметил, что внутри самой таблички
select * from table limit 1 order by date desc
нет данных старше месяца, как и должно, но размер таблицы всё время увеличиваетсся на диске, если сделать
select sum(bytes) from system_parts where table = 'table'
Куда смотреть, где копать?
(Таблиц на самом деле 5, на 5 шардах, объединенных одной distributed, но я думаю это не имеет особого значения в данном вопросе)
IMHO размер таблиц растет что у вас просто больше строк за следующий месяц, чем за предыдущий ну и надо смотрать на размер ативных партов а не просто сумму SELECT formatReadableSize(sum(total_bytes)) FROM system.tables WHERE name='XXX' или SELECT formatReadableSize(sum(bytes)) FROM system.parts WHERE table='XXX' AND active=1
Вот буквально только что сделал такие запросы, размер активных партов как раз 11.44ТБ, размер не активных в районе 20-50ГБ, постоянный разный, КХ видимо мерджит и удаляет старые парты, возможно вы правы, буду смотреть дальше
да, не активные парты примерно 7 минут хранятся перед удалением...
Обсуждают сегодня