184 похожих чатов

Всем Привет. В КХ появился тип MAP, в котором пара

ключ/значение хранятся как кортежи (tuple) в массиве, они не отсортированы по ключу, поэтому поиск занимает линейное время. Я хочу понять, почему так было сделано? Есть какая-то причина не делать бинарный поиск по отсортированым ключам (типа как flat_map в boost)?

9 ответов

22 просмотра

Потому что так сделать было достаточно просто. А всякие оптимизации вроде на потом запланированы были

sdev-E Автор вопроса
Dmitry [Altinity] Titov
Потому что так сделать было достаточно просто. А в...

Спасибо. А не в курсе, делает ли это кто-нибудь? У нас есть задача, которой нужен быстрый поиск по ключу/значению. MAP демонстрирует лучшую производительность, чем 2xArray, похоже за счет лучшей локальности. Бинарный поиск бы ее улучшил еще больше.

sdev E
Спасибо. А не в курсе, делает ли это кто-нибудь? У...

Наверное никто, большие у вас мапы выходят?

sdev-E Автор вопроса
Dmitry [Altinity] Titov
Наверное никто, большие у вас мапы выходят?

У нас большой QPS и большие объемы сканирования.

sdev E
У нас большой QPS и большие объемы сканирования.

Это не ответ :) Какого размера у вас мапы в среднем?

так нету смысла в этом никакого потому что это все лежит в 2 двух запакованых .bin файлах, все строки подряд, внутри строк неотсортированные Key толку-то сортировать, даже чтобы найти конкретную строку надо прочитать 8192 строки целиком, все KEY, все VALUE

sdev-E Автор вопроса
Denny [Altinity]
так нету смысла в этом никакого потому что это все...

Оно будет загружено в память, да. Но если сканирование ищет конкретный ключ, разве бинарный поиск не будет быстрее (если ключи отсортированы). Т.е. select id from mapped_table where map_field[‘key_string’] = ‘value’

sdev E
Оно будет загружено в память, да. Но если сканиров...

ну да все так, мы потратили 10 минут на чтение и распаковку .bin и поиск строки вы предлагает 3 сек. сэкономить, мудро в итоге все будет переделано вот так https://kb.altinity.com/altinity-kb-schema-design/best-schema-for-storing-many-metrics-registered-from-the-single-source/#2e-several-baskets-of-arrays это уже все переделано

sdev E
Спасибо. А не в курсе, делает ли это кто-нибудь? У...

это странное поведение. В чем разница MAP и 2 Array ? Вы как к Array обращаетесь? В общем я получил ускорение в 20 раз, сделав 20 пар Array, вместо 1 пары

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта