Всем привет! Ребят, такой вопрос по SQL. Есть датасет в

Question

Всем привет! Ребят, такой вопрос по SQL. Есть датасет в

CSV:

md5;value
test1;1
test2;1
test3;2
test4;4
Файлы могут быть миллионные.

Нужно брать данные из датасета в CSV и делать апдейт в SQL. В SQL соответственно тоже таблица тяжелая с индексами. Делать единичные транзакции такого типа не эффективно. Это длится вечность. Нужно как-то группировать. Посоветуете что-нибудь?

UPDATE table SET
(value) = ('1')
WHERE md5 = 'test1'
;

Можно погруппировать токены со одинаковыми value. И разбить на такие чанки. Но может есть что-нибудь эффективнее/умнее?

#backend #devops #pgsql #programming #russian

0

07.08.2019

1 ответов

34 просмотра

Alexeyer Er · Accepted Answer

Alexeyer Er

Для начала стоит знать: если файлы "милионные", то в md5 вполне вероятны коллизии.

0

07.08.2019

172 похожих чатов

Всем привет! Ребят, такой вопрос по SQL. Есть датасет в

1 ответов

Похожие вопросы