184 похожих чатов

Всем Привет. В КХ появился тип MAP, в котором пара

ключ/значение хранятся как кортежи (tuple) в массиве, они не отсортированы по ключу, поэтому поиск занимает линейное время. Я хочу понять, почему так было сделано? Есть какая-то причина не делать бинарный поиск по отсортированым ключам (типа как flat_map в boost)?

9 ответов

17 просмотров

Потому что так сделать было достаточно просто. А всякие оптимизации вроде на потом запланированы были

sdev-E Автор вопроса
Dmitry [Altinity] Titov
Потому что так сделать было достаточно просто. А в...

Спасибо. А не в курсе, делает ли это кто-нибудь? У нас есть задача, которой нужен быстрый поиск по ключу/значению. MAP демонстрирует лучшую производительность, чем 2xArray, похоже за счет лучшей локальности. Бинарный поиск бы ее улучшил еще больше.

sdev E
Спасибо. А не в курсе, делает ли это кто-нибудь? У...

Наверное никто, большие у вас мапы выходят?

sdev-E Автор вопроса
Dmitry [Altinity] Titov
Наверное никто, большие у вас мапы выходят?

У нас большой QPS и большие объемы сканирования.

sdev E
У нас большой QPS и большие объемы сканирования.

Это не ответ :) Какого размера у вас мапы в среднем?

так нету смысла в этом никакого потому что это все лежит в 2 двух запакованых .bin файлах, все строки подряд, внутри строк неотсортированные Key толку-то сортировать, даже чтобы найти конкретную строку надо прочитать 8192 строки целиком, все KEY, все VALUE

sdev-E Автор вопроса
Denny [Altinity]
так нету смысла в этом никакого потому что это все...

Оно будет загружено в память, да. Но если сканирование ищет конкретный ключ, разве бинарный поиск не будет быстрее (если ключи отсортированы). Т.е. select id from mapped_table where map_field[‘key_string’] = ‘value’

sdev E
Оно будет загружено в память, да. Но если сканиров...

ну да все так, мы потратили 10 минут на чтение и распаковку .bin и поиск строки вы предлагает 3 сек. сэкономить, мудро в итоге все будет переделано вот так https://kb.altinity.com/altinity-kb-schema-design/best-schema-for-storing-many-metrics-registered-from-the-single-source/#2e-several-baskets-of-arrays это уже все переделано

sdev E
Спасибо. А не в курсе, делает ли это кто-нибудь? У...

это странное поведение. В чем разница MAP и 2 Array ? Вы как к Array обращаетесь? В общем я получил ускорение в 20 раз, сделав 20 пар Array, вместо 1 пары

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
DS
8
Карта сайта