табличку одинаковые строки по ключу. Движок ReplicatedReplacingMergeTree.
Мало того, что он за 3 дня не удалил дубли (отложенное удаление я ожидал в какой-то такой срок), так еще и ручная дедупликация не дает никаких результатов.
Однако select с FINAL возвращает результат безх дублей.
Так как все-таки удалить дубли из таблички ?
https://clickhouse.com/docs/en/guides/developer/deduplication
только что это перечитал. Не нашел ответа на свой вопрос
не надо ничего удалять из таблички, надо писать запросы так, чтобы они были нечуствительны к дублям, т.е. либо FINAL и долго ждать, либо всякие агрегаты использовать с учетом вашей логики Ну или всетаки выбирать другую стратегию хранения и вставки а не полагаться на RMT движок, которй гарантий то не дает от дублей
Эмм. Почему ? В доке явно описано не использовать FINAL для больших табличек. И есть секция про дедупликацию. Ну и в любом случае, надо или не надо это второй вопрос, я не понимаю почему у меня не получается этого сделать
ну я написал ровно тоже самое - пишите ваши запросы так чтобы они корректно отрабатывали при наличии дублей в БД
Не знаю, вдруг кому интересно - строка в итоге удалилась. Помимо запусков Optimize апнул версию до следующей мажорной, что именно помогло не знаю. Если кто-то знает, с каким примерно лагом сам движок должен удалять дубли - буду признателен
Это значит что-то другое ?
Обсуждают сегодня