хороший вопрос мы у себя настраиваем шардинг на уровне distributed table так, чтобы записи для одного ключа всегда на одну и ту же ноду попадали. в этом случае дубликаты удаляются в бэкграунде, можно юзать optimize и не надо final использовать при селектах (он заметно снижает перформанс запроса на больших объемах)
Обсуждают сегодня