Доброго времени суток всем. Есть кейс, таблица на 170

Question

Доброго времени суток всем. Есть кейс, таблица на 170

миллионов записей, в ней есть поле id, оно по сути должно быть уникальным, как можно избавиться от неуникальных значений? создал вторую таблицу и пробовал перелить через distinct и отдельно еще с group by но distinct при большом количестве полей, берет просто все а на group by нехватает памяти на сервере ( пробовал заливать и по датам по пол года период). Есть ли еще какие нить способы?

#backend #clickhouse #database #devops #programming #russian

0

17.03.2020

1 ответов

35 просмотров

Дмитрий Бережнов · Accepted Answer

Дмитрий Бережнов

Почитайте про движок ReplacingMergeTree. Нужно будет в конец ORDER BY добавить ваш id. И тогда по крону можно будет явно чистить таблицу от дублей с помощью команды OPTIMIZE

0

17.03.2020

184 похожих чатов

Доброго времени суток всем. Есть кейс, таблица на 170

1 ответов

Похожие вопросы