Как можно это ускорить? Суть, есть база грязная, в ней

туча дублей, дубли разные могут содержать дополнительные полезные поля.
Нужно найти эти дубли, выбрать из них самый полезный, остальные удалить. Сделал команду


public function handle()
{
$this->info('Проверяем дубликаты в ...');


// Поиск дубликатов с учетом регистра
$duplicates = DB::table('point')
->select(DB::raw('BINARY(name) as name'), 'addres', DB::raw('COUNT(*) as count'))
->groupBy(DB::raw('BINARY(name)'), 'addres')
->havingRaw('COUNT(*) > 1')
->get();

$progressBar = new ProgressBar($this->output, count($duplicates));
$progressBar->setFormat('%current%/%max% [%bar%] %percent:3s%% %elapsed:6s%/%estimated:-6s% Осталось времени: %remaining:6s% Использование памяти: %memory:6s%');
$progressBar->start();

$deletedCount = 0;

foreach ($duplicates as $duplicate) {
// Получение всех записей-дубликатов
$records = DB::table('point')
->where(DB::raw('BINARY(name)'), $duplicate->name)
->where('addres', $duplicate->addres)
->get();

$minFields = PHP_INT_MAX;
$recordToDelete = null;

foreach ($records as $record) {
// Подсчет количества заполненных полей
$filledFields = count(array_filter((array)$record, function ($value) {
return !is_null($value) && $value !== '';
}));

// Выбор записи с наименьшим количеством заполненных полей
if ($filledFields < $minFields) {
$minFields = $filledFields;
$recordToDelete = $record;
}
}

if ($recordToDelete) {
// Удаление записи без подтверждения
DB::table('point')
->where('id', $recordToDelete->id)
->delete();
$deletedCount++;
}

$progressBar->advance();
}

$progressBar->finish();
$this->line('');
$this->info("Удалено $deletedCount дубликатов.");
}

2 ответов

20 просмотров

Обрами в код, а то паршиво ясно)) На первый взгляд можно запросить все дубликаты сразу сгруппировав уже коллекцию. А запрашивать используя группировку с хэвинг как подзапрос. select * from point where id in (select id from point group by binary(name),addres having count(*) > 1)

Денис-Александрович Автор вопроса
Vladimir 
Обрами в код, а то паршиво ясно)) На первый взгля...

Мне нужно проверить каждый дубль отдельно, так как внутри может быть несколько записей одинаковых

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта