(не GROUP BY */HAVING COUNT(*) > 1) Выглядит как анти задача для колоночных БД
не совсем понятно что нужно. но может вы в поиске OPTIMIZE TABLE name DEDUPLICATE ?
это удалит дубликаты, да, спасибо, интересный метод. Но я бы хотел найти дубликаты, а не удалить
в общем случае эффективно по памяти это не будет нигде, к колоночным Субд не имеет отношения
а какие объёмы? мб попробовать что-то такое SELECT * FROM table WHERE xxHash64(*) IN (SELECT xxHash64(*) as hash FROM table GROUP BY hash HAVING COUNT() > 1) можно попробовать урезать по каким-то дименшенам (с небольшой вариативностью) и искать дубликаты пачками
Обсуждают сегодня