184 похожих чатов

Раз уж тут обсуждается мап, позволю себе поднять старый вопрос:

есть ли какие-то планы по работе с map как с хэш-таблицей (в части доступа за единицу вместо линии, если быть точным)? По банальным тестам все выглядит так, что поиск по ключу в map работает медленнее, чем, например JOIN временной таблицы из этих же значений (видимо, потому, что JOIN создает хэш-таблицу)

Или мы что-то упускаем?

3 ответов

11 просмотров

Условно, map это некоторый "сахар" над двумя массивами: ключи и значения. В КХ нет и невозможны индексы в классическом их понимании из-за объема хранящихся данных и особенностей хранения (блоками). Те всегда читаем много и, относительно, oltp - долго.

Anton- Автор вопроса
Kirill Shvakov
Условно, map это некоторый "сахар" над двумя масси...

да, я так и понял, но не совсем ясно, что мешает на лету превращать Map в хэш-таблицу, если запрос использует индексер? Это ведь O(N), вроде ничего не теряем. А вот из-за того, что это не делается, наблюдаются вот такие приколы: SELECT count(*) FROM ( WITH map(0, 1, ..., 255) AS lookup SELECT number, lookup[n.number % 256] FROM numbers(1e8) n ) 1 rows in set. Elapsed: 4.974 sec. Processed 100.03 million rows, 800.21 MB (20.11 million rows/s., 160.88 MB/s.) SELECT count(*) FROM ( WITH lookupTable AS (SELECT 0 key, 1 value UNION ALL SELECT 2 key, 3 value ... UNION ALL SELECT 254 key, 255 value) SELECT number, lookupTable.value FROM numbers(1e8) n INNER JOIN lookupTable ON lookupTable.key = n.number % 256 ) 1 rows in set. Elapsed: 1.411 sec. Processed 100.03 million rows, 800.21 MB (70.88 million rows/s., 567.06 MB/s.)

Anton- Автор вопроса
Anton
да, я так и понял, но не совсем ясно, что мешает н...

ну и да, линия вылазит стоит только увеличить N: SELECT count(*) FROM ( WITH map(0, 1, ..., 1023) AS lookup SELECT number, lookup[n.number % 1024] FROM numbers(1e8) n ) 1 rows in set. Elapsed: 17.441 sec. Processed 100.03 million rows, 800.21 MB (5.73 million rows/s., 45.88 MB/s.) в то время, как SELECT count(*) FROM ( WITH lookupTable AS (SELECT 0 key, 1 value UNION ALL SELECT 2 key, 3 value ... UNION ALL SELECT 1022 key, 1023 value) SELECT number, lookupTable.value FROM numbers(1e8) n INNER JOIN lookupTable ON lookupTable.key = n.number % 1024 ) 1 rows in set. Elapsed: 1.265 sec. Processed 100.03 million rows, 800.21 MB (79.05 million rows/s., 632.38 MB/s.)

Похожие вопросы

Обсуждают сегодня

Типа вызывать GetParent и проверять на соответствие GetModuleHandle?
The Bird of Hermes
67
Do any of you guys have interesting projects one could join? I'm a Middle Full-Stack developer (JS/TS, React & Node)
Lev Shapiro
40
$res = json_decode($наша строка из респонса); $res1 = array_map(fn($o) => $o->name, $res->breadcrumbs[0]->entities); Как такое будет на Хаскеле?.. В начале весь джейсон, в ко...
Хаскель Моисеевич Гопник
27
В чем сила брат, в NASM или FASM?
Isaac Kleiner
18
Вопрос по диагностике ошибок (я знаю в чем, в данном конкретном примере, я знаю, как исправить, пример модельный, понятно, что в реальности бывает намного запутаннее). module...
ⰄⰎⰋⰐⰐⰑⰛⰤⰧⰧⰩⰄ ⰊⰑⰁⰓⰡⰛⰦⰕⰫ
11
Хтось використовував Vapor на Windows?
Jaroshevskii
15
А чем вам питонисты не угодили?😂
.
79
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
52
Тут кста кто-нибудь NeoVim использует?
Simple Sorcerer
13
Оба варианта в целом подходят, но скорее создание конфликтной ситуации (на пустой основе). В прошлый раз он сказал мне про ESP32, я забыл про этот микроконтроллер, ошибся, я п...
КТ315
4
Карта сайта