Интересно, какой гений придумал что std::set и std::multiset удовлетворяют AssociativeContainer?...

Sergey Skvortsov
Ну а в плюсах queue через deque, но queue же не уд...

Это намёк, что set это map на unit_type

0

28.12.2021

Evgeny Sh.
Во всех остальных известных мне языках, "ассоциати...

add a pair to the collection; remove a pair from the collection; modify an existing pair; lookup a value associated with a particular key set<pair<T1, T2>> всё это вполне может (надо только аккуратно посмотреть, что нужная гетерогенная операция будет)

0

28.12.2021

как-то не очень по табличке сходится, у вектора тяжеловато с contains() за логарифм

0

28.12.2021

Dmitriy [Отпуск]

Отсортируем!

0

28.12.2021

Dmitriy [Отпуск]
Отсортируем!

тогда с insert сложновато будет

0

28.12.2021

Andrei Tokmakov

Constantine Drozdov
как-то не очень по табличке сходится, у вектора тя...

ну зависит от размера (количества элементов) даже поиск перебором по НЕ сортированному вектору может быть быстрее поиска по дереву : Big O не всегда отражает реальную скорость

0

28.12.2021

Andrei Tokmakov
ну зависит от размера (количества элементов) даже ...

а сортировку вставками бинпоиск так вообще всегда замедляет, я в курсе констант реальных вычислительных устройств)

0

28.12.2021

Да но иногда это очень важно. Для таких случаев они и есть как я понимаю.

0

28.12.2021

Konstantin Vladimirov
Да но иногда это очень важно. Для таких случаев он...

Мне кажется, что это просто ошибка проектирования зари STL, когда cache friendly было не так важно

0

28.12.2021

Constantine Drozdov
Мне кажется, что это просто ошибка проектирования ...

Почему ошибка-то? Вам дают возможность делать и так и так. Это преимущество а не ошибка.

0

28.12.2021

Konstantin Vladimirov
Почему ошибка-то? Вам дают возможность делать и та...

Потому что в другую сторону можно обеспечить пользовательским кодом. Это лишняя гарантия.

0

28.12.2021

Constantine Drozdov
Потому что в другую сторону можно обеспечить польз...

Не надо решать за людей какие гарантии им лишние. Вам лишняя, кому-то другому в самый раз =)

0

28.12.2021

Konstantin Vladimirov
Не надо решать за людей какие гарантии им лишние. ...

А если эта гарантия вам не нужна (99% случаев), то у вас нет подходящего решения, только очень медленное

0

28.12.2021

Constantine Drozdov
А если эта гарантия вам не нужна (99% случаев), то...

В смысле нет? Если не нужна то есть перечисленные выше аналоги.

0

28.12.2021

Konstantin Vladimirov
Не надо решать за людей какие гарантии им лишние. ...

Представьте, что в std будет добавлен именованный shared_mutex и не будет всех остальных примитивов синхронизации

0

28.12.2021

Constantine Drozdov
Представьте, что в std будет добавлен именованный ...

Но это явно не тот случай. Добавили же и вектор и обычный map.

0

28.12.2021

Konstantin Vladimirov
Но это явно не тот случай. Добавили же и вектор и ...

Но не добавили быстрый map, который именно что отображает элементы.

0

28.12.2021

Constantine Drozdov
Но не добавили быстрый map, который именно что ото...

Поясните? Типа бустового flat_map?

0

28.12.2021

Konstantin Vladimirov
Поясните? Типа бустового flat_map?

Ну посмотрите сравнение производительности unordered_map<int, int> и хеш-таблиц открытой адресации

0

28.12.2021

Arelav

Constantine Drozdov
Представьте, что в std будет добавлен именованный ...

Плохой пример, было бы норм если бы shared_mutex написали нормально

0

28.12.2021

Constantine Drozdov
Ну посмотрите сравнение производительности unorder...

А как они в бусте называются? Если их нет в бусте то напишите, предложите в стандартную библиотеку, прославьтесь =)

0

28.12.2021

https://probablydance.com/2017/02/26/i-wrote-the-fastest-hashtable/ как будто все об этом не знают)

0

28.12.2021

Constantine Drozdov
https://probablydance.com/2017/02/26/i-wrote-the-f...

Вот более актуальные бенчмарки, там цифры поинтереснее https://martin.ankerl.com/2019/04/01/hashmap-benchmarks-01-overview/

0

28.12.2021

Mikelangelo 🇩🇪🚜🇷🇺

а почему пики и падения есть? с чем связано падение сложности после пика?

0

28.12.2021

Sergey Skvortsov
Вот более актуальные бенчмарки, там цифры поинтере...

Ага, почти 10 уже)

0

28.12.2021

magras

Constantine Drozdov
add a pair to the collection; remove a pair from t...

Modify не получится так как константой является вся пара, а не только первая компонента.

0

28.12.2021

magras
Modify не получится так как константой является вс...

через extract там можно всё modify нынче

0

28.12.2021

Mikelangelo 🇩🇪🚜🇷🇺
а почему пики и падения есть? с чем связано падени...

я не разбирал графики настолько детально, но полагаю, что там реаллокация и прыгающий load_factor

0

28.12.2021

Constantine Drozdov
https://probablydance.com/2017/02/26/i-wrote-the-f...

Посмотрел. Насколько я понимаю обгон делается не отказом от гарантий по итераторам а просто более эффективными алгоритмами. То есть проектирование правильное, критикуется конкретно реализация в libstdc++.

0

28.12.2021

Konstantin Vladimirov
Посмотрел. Насколько я понимаю обгон делается не о...

Это построение в принципе не работает для неперемещаемых ключей

0

28.12.2021

Dmitriy [Отпуск]

Konstantin Vladimirov
Посмотрел. Насколько я понимаю обгон делается не о...

Отказом в том числе - flat_map нереализуема без такового

0

28.12.2021

Konstantin Vladimirov
Посмотрел. Насколько я понимаю обгон делается не о...

Нет же, там одна большая аллокация памяти в хешмапе

0

28.12.2021

Arelav

Sergey Skvortsov
Вот более актуальные бенчмарки, там цифры поинтере...

Не очень ясно зачем в бенчмарках emilib1 или ska, да и думаю некоторые другие, они вроде бажные. Вообще мне кажется практически всегда достаточно absl. Кст если говорить о мапах, то по-моему довольно прикольная штука: https://github.com/serge-sans-paille/frozen

0

28.12.2021

Arelav
Не очень ясно зачем в бенчмарках emilib1 или ska, ...

Да, у автора есть вывод в конце, что хорошая дефолтная мапа — absl Ну и с тех пор ещё два года прошло

0

28.12.2021

Constantine Drozdov
https://probablydance.com/2017/02/26/i-wrote-the-f...

У открытой адресации есть небольшой изъян, worse case. Который не предугадать. И этот товарищ сделал вид что его обошёл. Чутка покукушил и в rehash. Что приведёт к жору памяти в неприятных случаях.

0

28.12.2021

Dmitry Sokolov
У открытой адресации есть небольшой изъян, worse c...

В смысле worst case? Хеш плохой? И там робингудят

0

28.12.2021

Dmitry Sokolov
У открытой адресации есть небольшой изъян, worse c...

Ну нужно хеш получше подобрать, чем id

0

28.12.2021

В chaining схеме надо просто пройти по коллизиям. В open addressing надо использовать алгоритм обхода который в худшем случае для любой из схем будет O(n). И одна косвенная адресация, ну какой 10-кратный рост? Разве что в искусственных int-int мапах

0

28.12.2021

Dmitry Sokolov
В chaining схеме надо просто пройти по коллизиям. ...

ты не веришь, что vector<T> может быть быстрее list<T> в 10 раз в качестве стека?) хуже O(n) не может быть, и там никогда не будет O(n), потому что робин гуд, говорю

0

28.12.2021

Constantine Drozdov
ты не веришь, что vector<T> может быть быстрее lis...

Я не верю что в качественном hashmap одна лишняя косвенная адресация делает 10x

0

28.12.2021

Dmitry Sokolov
Я не верю что в качественном hashmap одна лишняя к...

Почему одна-то? Цепочки непустые обычно, да и unordered_map трогает память неаккуратно в целом

0

28.12.2021

Dmitry Sokolov
Я не верю что в качественном hashmap одна лишняя к...

для начала давай заметим, что в любом односвязном списке O(N) указателей имеет значение nullptr :)

0

28.12.2021

Dmitry Sokolov
В chaining схеме надо просто пройти по коллизиям. ...

Стоит попробовать современные хешмапы у себя, вы будете приятно удивлены

0

28.12.2021

Dmitry Sokolov
Я не верю что в качественном hashmap одна лишняя к...

так что в качестве априорного оверхеда за корзиночно-списочной схемы будет размер_буфера*sizeof(указателя) мусора в кэше просто так

0

28.12.2021

Dmitry Sokolov
Я не верю что в качественном hashmap одна лишняя к...

но на самом деле худшее, что можно сделать кэшу, это написать a[i][j] для int** а, потому что нужно два раза подряд вычитать память и спекуляция вряд ли справится с таким; именно таким занимается списковая хешмапа

0

28.12.2021

Constantine Drozdov
так что в качестве априорного оверхеда за корзиноч...

Для того чтобы обеспечить минимальное количество коллизий нужно табличку то с запасом держать, так что sizeof value тоже даст о себе знать, причём намного раньше

0

28.12.2021

Dmitry Sokolov
Для того чтобы обеспечить минимальное количество к...

Ну так и куча мелких аллокаций тоже не бесплатная в плане оверхеда

0

28.12.2021

Dmitry Sokolov
Для того чтобы обеспечить минимальное количество к...

в открытой накладные расходы 1 бит за ячейку для элемента, а не 8 байт

0

28.12.2021

Constantine Drozdov
в открытой накладные расходы 1 бит за ячейку для э...

Соотноси 8/sizeof value

0

28.12.2021

Dmitry Sokolov
Соотноси 8/sizeof value

Ну ладно. Давай так. Сделаем открытую хеш-таблицу, только будем делать записи в виде указателей на элементы, и добавим к ней аллокатор для самих элементов. Заметь, это всё ещё меньше расходов, чем в корзиночной хеш-таблице, потому что нет расходов на формирование односвязного списка.

0

28.12.2021

Dmitry Sokolov
Соотноси 8/sizeof value

В этом сравнении некорректность, потому что ты считаешь бесплатным аллокатор для элементов списка

0

28.12.2021

Constantine Drozdov
В этом сравнении некорректность, потому что ты счи...

Неее, а если sizeof например килобайт. Зачем мне платить за такую таблицу?

0

28.12.2021

Dmitry Sokolov
Неее, а если sizeof например килобайт. Зачем мне п...

Ну это же вырожденный случай, положите в таблицу указатели

0

28.12.2021

Dmitry Sokolov
Неее, а если sizeof например килобайт. Зачем мне п...

Я же тебе выше предложил способ переделать открытую адресацию в то, что кажется тебе быстрее :)

0

28.12.2021

Constantine Drozdov
Я же тебе выше предложил способ переделать открыту...

Ну давай за быстродействие, chaining = одна косвенная адресация в лучшем случае + проход по списку коллизий. Open addressing для второго варианта вообще не гарантирует же толком ничего даже если коллизий мало.

0

28.12.2021

Dmitry Sokolov
Ну давай за быстродействие, chaining = одна косвен...

Да ровно такая же гарантия, потому что open addressing имеет меньше накладных расходов и при том же memory usage будет работать на меньшем load factor

0

28.12.2021

Dmitry Sokolov
Ну давай за быстродействие, chaining = одна косвен...

Заметь, я экономлю один указатель на элемент в варианте unique_ptr внутри open addressing, мне этого хватит, чтобы load factor из 0.5 сделать 0.33

0

28.12.2021

Constantine Drozdov
Заметь, я экономлю один указатель на элемент в вар...

Chaining легко работает при load factor близких к единице. Open addressing при этом начнет конечно жутко лажать

0

28.12.2021

Dmitry Sokolov
Chaining легко работает при load factor близких к ...

Близкий к 1 load factor означает ожидаемое количество проверок порядка 2 и соответствует load factor 0.5 для open addressing по расходу памяти)

0

28.12.2021

Arelav

Dmitry Sokolov
Для того чтобы обеспечить минимальное количество к...

В случае открытой контроль sizeof value и запоминание хеша отдаются на откуп пользователю

0

28.12.2021

Sergey Skvortsov · Accepted Answer