170 похожих чатов

Кто нибудь знает constexpr реализацию state-mashine? Ну типа есть токены "true",false,Истина,Ложь,Да,Нет... И

нужно реализовать парсинг и отдать token-id
?

36 ответов

11 просмотров

Что значит "constexpr реализация"? Она должна в компайлтайме пробежаться по состояниям в зависимости от какой-то константы?

Int-Unsigned Автор вопроса
Max
Что значит "constexpr реализация"? Она должна в ко...

Ну задаешь список токенов, а оно само строит state-машину. Как то...

Всё ещё не понимаю, что это за токены и как это относится к стейт машине. Звучит как парсер какой-то заданной грамматики. Если я нагадал на кофейной гуще верно, то может помочь boost.spirit.x3

Int-Unsigned Автор вопроса
Max
Всё ещё не понимаю, что это за токены и как это от...

Пусть есть допустимый набор строк "мама", "мыла", "раму". Нужно вернуть соответственно 0,1,2 или Ош скажем -1 если что то не то. Без лишних телодвижений. Набор строк произволен и задаётся в коде. Если набор строк неоднозначен - не компилируется с умным сообщением.

Int-Unsigned Автор вопроса
Max
То есть, тупо constexpr мапа?

Возможно, но реализацию смотреть надо. Есть?

Int-Unsigned Автор вопроса
myrrc Кот
https://github.com/serge-sans-paille/frozen

Крутая штука. Но они используют bits::binary_search<N>(items_.begin().... То есть бинарный поиск по сортированному массиву. В случае строковых ключей он всегда начинает с начала строки. Я и сам так могу. То есть надо - если мы съели "м", то перешли в состояние 2 где у нас варианты только "ама" и "ыла". И если следующий символ "а", то наше состояние только "ма" или ошибка. С каждым символом область допустимых значений должна сжиматься.

Int Unsigned
Пусть есть допустимый набор строк "мама", "мыла", ...

Всё ещё не понимаю задачу. Почему, например, не подходит тупо consteval int str_id(std::string_view view) { if (view == "мама") return 1; if (view == "мыла") return 2; if (view == "раму") return 3; return -1; }

Int-Unsigned Автор вопроса
Max
Всё ещё не понимаю задачу. Почему, например, не п...

Так не consteval нужен, а ран-тайм. При consteval мне (практически) без разницы сколько оно думает. А в рантайме сравнение каждый раз идёт с начала. То есть "мама" и "мыла" начинаются с буквы "м". Соответственно оптимальный алгоритм выглядит switch(ch) case 'm': goto state_m ... state_m: switch(ch) case 'а' case 'ы' .... А вот эти switch-case я хочу в компиле-тайм построить

Int Unsigned
Так не consteval нужен, а ран-тайм. При consteval ...

префиксное дерево построить хочешь?

Int Unsigned
Так не consteval нужен, а ран-тайм. При consteval ...

https://userver.tech/d9/dbf/classutils_1_1TrivialBiMap.html

feedable
это разве не в рантайме?

Там все функции constexpr помечены, если что

다니엘(줄리아)
Там все функции constexpr помечены, если что

Так constrexpr != consteval. Constexpr может и в runtime, и в compiletime.

Int Unsigned
Так не consteval нужен, а ран-тайм. При consteval ...

Стоит, как минимум, подумать (а лучше измерить) даст ли это хоть какое-то ускорение по сравнению с нормальной небранчующейся хэш-функцией. Например, CityHash.

feedable
и что?

Ну зайди посмотри генерируемый асм, я не знаю. Или доклады актуальные от Полухина посмотри, тоже узнаешь. Спойлер: компилятор генерирует префиксное дерево

Int-Unsigned Автор вопроса
feedable
это разве не в рантайме?

/// constexpr utils::TrivialBiMap kToInt = [](auto selector) { return selector() .Case("zero", 0) .Case("one", 1) .Case("two", 2) .Case("three", 3) .Case("four", 4); }; /// Это по мотивам llvm StringSwitch. У меня такое есть. Для десятка кейсов пофиг. А для 1500 тяжко

다니엘(줄리아)
Ну зайди посмотри генерируемый асм, я не знаю. Или...

там 99% кодогена не будет, а будет хождение по глобальному массиву

다니엘(줄리아)
Там кодген

ну кинь годболт

feedable
ну кинь годболт

Сам зайди и убедись

ахуеть

다니엘(줄리아)
Там все функции constexpr помечены, если что

Констэкспр и в рантайме работать может

feedable
ахуеть

Я сам делал и убеждался, что там компилятор хорошо оптимизирует. А еще я верю тому, что написано в документации: utils::TrivialBiMap and utils::TrivialSet are known to outperform std::unordered_map if: • there's 32 or less elements in map/set • or keys are string literals and all of them differ in length. Implementation of string search is very efficient due to modern compilers optimize it to a switch by input string length and an integral comparison (rather than a std::memcmp call). In other words, it usually takes O(1) to find the match in the map. The same story with integral or enum mappings - compiler optimizes them into a switch and it usually takes O(1) to find the match. Если ты фома неверующий - это твоя проблема

feedable
switch by string length

Компилятору явно виднее, в каких случаях это лучше, чем прямое префиксное дерево

feedable
но кодогена там итого нет

Если ты фома неверующий - это твоя проблема

Int Unsigned
Так не consteval нужен, а ран-тайм. При consteval ...

Что-то вроде такого не пойдет? https://github.com/hanickadot/compile-time-regular-expressions https://github.com/cmargiotta/e-regex

다니엘(줄리아)
Если ты фома неверующий - это твоя проблема

ты сам в доку показал что там нет, кому мне верить и почему я должен верить вотбще кому-то

Int Unsigned
Так не consteval нужен, а ран-тайм. При consteval ...

в зависимости от конкретных данных и железа, оптимальный алгоритм также может выглядеть как "взять gperf либо аналог"

Похожие вопросы

Обсуждают сегодня

читать файл максимально быстро? странный вопрос))
zamtmn
53
Привет. Сразу скажу, что на C/C++/Rust я не пишу, но тем не менее возникла потребность дебага C/C++/Rust кода. Суть: есть серверное приложение, которое периодически ведёт себ...
ninekeem 🐳
4
А чего сейчас в моде вместо Error для эксепшенов? А то я тут внезапно узрел что он не рекомендуется :) У Try::Tiny какой-то совершенно ужасный синтаксис если надо конкретные э...
Denis F
16
всем привет! углубившись в плюсы и начав изучать реверсинг понял, что без асм'а никуда со своими высокоабстрактными представлениями начал изучать механизмы асма, и не совсем п...
9
буквально один оставшийся вопрос при выполнении строчки mov eax, 5 операнд "5" будет присутствовать где-либо в памяти (любой), кроме как в памяти блока .code? подвопрос: как...
12
Всем ку. Подскажите, если задекларировал массив так: int arr[10] = {1, 2, 3, 4}, то в arr[4] будет мусор или нуль?
Sasha K
14
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
я не понимаю mov [r11+8],rcx и прочие. мы записываем значение из rcx, куда?
Bor
15
у меня такой вопрос про память в x86 возник, может кто пояснить?.. у процессора есть (как минимум) 3 типа адресов (названия "п1", "п2", "п3" --- мои, чтобы проще было дальше)...
Toideng
5
А какие расширения активно используются в промышленности? Именно идейные, по типу гадт, а не всякие оверлоадедстрингс
Степан
11
Карта сайта