184 похожих чатов

Добрый вечер. Как можно оптимизировать проверку в условии IN, если внутри

подзапрос возвращающий больше 100 млн значений?
Есть такой запрос:
select ...
from big_table
where ...
and obj_hash in ( select obj_hash from obj_white_list_100m )

Он проверяет, что значения obj_hash содержаться в "белом" списке объектов. Посмотрел в логах - там создаётся хэш-таблица, она занимает 10гб оперативки и на это уходит минута времени примерно.

Я сначала подумал использовать словарь и dictHas, но многовато наверное для словаря (больше 100 млн записей сейчас)?

3 ответов

7 просмотров

ну никак. Это самый быстрый вариант. Тут даже без КХ сложно придумать как это сделать быстрее.

А в select из большой таблицы, если не брать последнее отсечение по хэшу из whitelist, сколько получается данных? Правый whitelist динамический (может со временем меняться) или просто большая статическая таблица?

Можно переделать эту таблицу на engine=join, чтобы она всегда была в памяти

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
Кибер Бомж
8
Карта сайта