184 похожих чатов

13 ответов

7 просмотров

в replacingMT есть 3 типа колонок: 1. те, что в ORDER BY — ключи дедупликации 2. опциональный version (не мб в ORDER BY) — отвечает за выбор строки (если нет, то остается последняя по вставке строка) 3. остальные — значения дедуплицируются что вы хотите получить?

Kuzma-Leshakov Автор вопроса
Tagir Gumerov
в replacingMT есть 3 типа колонок: 1. те, что в O...

Дедупликацию дубликатов по всем колонкам таблицы (п1)

Kuzma Leshakov
Дедупликацию дубликатов по всем колонкам таблицы (...

можно последним значением в ORDER BY добавить cityHash(*);

Kuzma Leshakov
Дедупликацию дубликатов по всем колонкам таблицы (...

простой ответ: запихивайте все столбцы в order by чуть более правильный ответ: не надо запихивать все столбцы в order by кейс заключается в том, что вы пишете полные дубликаты и хотите от них избавляться?

Kuzma-Leshakov Автор вопроса
Tagir Gumerov
простой ответ: запихивайте все столбцы в order by ...

"чуть более правильный ответ" критикуешь - предлагай)

Kuzma Leshakov
"чуть более правильный ответ" критикуешь - предлаг...

так я написал про 2 ответа и уточнил у вас кэйс вы ответили, но рядом Дмитрий Титов предложил отличный вариант с cityHash

Kuzma-Leshakov Автор вопроса
Tagir Gumerov
так я написал про 2 ответа и уточнил у вас кэйс вы...

Я подумал, что у вас был свой вариант, но вы его не написали 🙌

Kuzma Leshakov
Я подумал, что у вас был свой вариант, но вы его н...

на самом деле не было кроме вариантов использовать optimize table ... deduplicate (тоже не ахти вариант) или выяснения подмножества столбцов, которых было бы достаточно для дудупликации но есть привычка уточнять кэйс перед тем, как советовать что-то специфичное

Kuzma-Leshakov Автор вопроса
Kuzma Leshakov
чем плохо перечисление всех колонок?

В первом приближении потому что дедубликация идёт по ключу сортировки, и если явно не указать разные ключ сортировки и pk, то все столбцы полетят в оперативку (немного натянуто). Во втором приближении даже в фоне дорого сравнивать полные строки, сколько у вас столбцов? 5, 10, 100500? А решение с cityHash аккуратно закрывает обе проблемы

Похожие вопросы

Обсуждают сегодня

Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Hi guys, I'm looking for a good LLM course. Is there any course to learn LLMs in advanced? I'm aiming to use them in my apps, so a perfect course in my openion, is not only a ...
Taha
14
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
Всем привет. Подскажите, пожалуйста, как вы реализовываете следующий функционал. Допустим есть форма, в которой имеется выпадающий список со значениями. Значения хранятся в БД...
Евгений
7
Хех, данные на форме всегда будут "из прошлого", т.к. перезаполнять поля формы в процессе редактирования пользователем - так себе идея. Пользователь может открыть форму редакт...
Alexander Somov
7
$params = [ 'formid' => 'feedbackForm', 'formTpl' => '@CODE: <form class="form-validate" data-id="ajax_form"> <fieldset class="margin-bottom-md"> ...
Pathologic
1
Хотел бы спросить у знающих, правильную ли я выбрал книгу для начала изучения ассемблера Юрова В.И ? Или есть более лучшие книги для начала обучения?
Botsman
31
Карта сайта