всё семейство ReplicatedMergeTree или для всго MergeTree? И если я иду вообще в неправильном направлении, может надо архитектуру поменять?
Таблица такой структуры.
Ключ состоит из трех колонок(timestamp(minutely), int, int) и плюс ещё где-то 20 колонок int и decimal, которые надо суммировать. Репликацию использую в качестве бекапа, все инсерты на один хост идут. Инсерты раз в минуту большими порциями(3-5 млн строк)
в реальной жизни пачка из 1000тыс строк естественным образом повторится не может (вероятность 0%) дедупликация -- любые репликатид, в зукипере хешсумма последних 100 бклоков , хранится неделю. Все это настараивается и выключается. но еще раз "в реальной жизни пачка из 1000тыс строк естественным образом повторится не может (вероятность 0%)"
>Инсерты раз в минуту большими порциями(3-5 млн строк) а что такое инсерт? insert into values () () () () ()миллион раз -- это пачка vs insert into values (); insert into values (); ... миллион раз -- это миллион пачек insert into values ();
Обсуждают сегодня