172 похожих чатов

Кстати, а подскажите кто шарит, как лучше всего удалять дубликаты?

У меня тут запрос после 2ух дней работы лег, я приуныл слегка... Разбил данные на 300 кусков (по 100к строк) и в 15 потоков запустил. Харды еле шуршат, может посоветуете как более оптимально написать запрос?

Я выбрал дубли в отдельную таблицу и запилил удаление:

egrip=# explain delete from egrip_versions v USING dups_ip2 where dups_ip2.ogrn = v.ogrn and dups_ip2.checksum = v.checksum and v.version < dups_ip2.ver and v.ogrn >= 0 and v.ogrn <= 10;
Delete on egrip_versions v (cost=1.13..17.30 rows=1 width=12)
-> Nested Loop (cost=1.13..17.30 rows=1 width=12)
-> Index Scan using egrip_versions_ogrn_version_idx on egrip_versions v (cost=0.57..8.59 rows=1 width=51)
Index Cond: ((ogrn >= 0) AND (ogrn <= 10))
-> Index Scan using dups_ip2_ogrn_idx on dups_ip2 (cost=0.56..8.70 rows=1 width=51)
Index Cond: (ogrn = v.ogrn)
Filter: ((v.version < ver) AND (v.checksum = checksum))
(7 rows)

Но у меня 100к строк удаляются где-то по часу (на 100к - 140к дублей)

3 ответов

6 просмотров

Странный план какой-то, на первый взгляд (оценки странные; и похоже, что индексы тут не оптимальные). Вы делали VACUUM ANALYZE каждой из этих таблиц? А, ещё: > Разбил данные на 300 кусков (по 100к строк) и в 15 потоков запустил. Какие данные / как "разбили" (мне, например, непонятно)?

дробить на кусочки, которые за 2-5 минут отрабатывают (10к, скажем) и в несколько потоков

может перелить в новую таблицу с уникальным индексом по ним и on conflict do nothing?

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Anyone knows how to build this widget in Flutter? I have all the assets for round stations and the road, but how can I make the my widget animate between these stations? And h...
Mohammad Zamani
9
короче я не выдержал постоянно определять структуры, чтобы возвращать массивы разных типов. Как обычно еще это делают?
Павλо 🇺🇦
7
Если у очереди установлено x-message-ttl, при получении сообщения из этой очереди, можно узнать остаток времени жизни сообщения?
Сергей
8
Подскажите как мне лучше держать websocket сединение и переодически передавать в него данные? Сначала я сделал так: for _ in 1...1000 { try? await ws.send("test") try...
Mihail Verenich
2
Ты просто гитлеровскую эстетику плохо понимаешь. Он же всё под Цезаря делал. А это как бы запрещённый приём в политике. Пиджаки они зачем все носят? Чтобы показать что они тип...
Ivan Kropotkin
4
А цены чем оправданы?
Lencore
7
Карта сайта