дату и сделать что-то, чтобы дубликаты пропали. При этом, возможно данных за эту дату раньше не было в таблице. optimize отрабатывает в 5 раз быстрее, чем optimize final, но его не всегда достаточно, верно?
я решил не надеятся на 100% удаление и перенес таблицу в которой были дубли в другую новую таблицу через DISTINCT
Раз вы добавляете одну дату - вам нужно перетряхнуть только конкретную партицию, в которую эта дата попала, это должно быть быстрее чем OPTIMIZE на всей таблице. Как под капотом отработает optimize partition и optimize partition final - я не могу подсказать, но знаю по опыту, что optimize partition final достаточно, чтоб следующие за ним селекты не увидели дубликатов
Обсуждают сегодня