с проблемой проиндексировать 6 млрд строк.
Сразу скажу что ищу полное совпадение т.е. строка1 = строка2
using hash - быстро создаёт индексы
using btree - медленно в разы
Но вот, при поиске в базе 6 млрд строк, проиндексированных хэшем - нагружает хард на 100% , поиск идёт около 40-100 строк в секунду
Будет ли быстрее искать, если индексировать по бтрии?
Ищу вот так
select mydata from alldata where mydata = 'строка'
т.е. для каждой строки - отдельный запрос
а что индексируете ? какой тип данных или составной ключ ?
А версия Pg старше 10-й? А то там HASH переделали.
Обсуждают сегодня