169 похожих чатов

И еще один вопрос. Хочу написать поиск вхождения подстроки в тексте

большого размера. Пока придумал только вот-такой алгоритм:

Исходный шаблон проходим побайтно через mov ax, [ebx] . Очередной байт ищем через scansb. Если не находим откатываемся на байт назад и снова ищем следующее вхождение. И так до тех пор, пока не будет достигнут конец шаблона — вхождение найдено, либо конец текста — вхождения нет.

Но может быть есть еще какой вариант алгоритма?

13 ответов

12 просмотров

А если UTF8 или 16? Не, там немного сложнее. Пару лет назад такое же делал, т.к. всякие питоны не смогли переварить большие файлы

КМП вам в помощь , или Рабин-карп

Alexander-Morozov Автор вопроса
Сергей
А если UTF8 или 16? Не, там немного сложнее. Пару ...

Я ожидаю, что подстрока и строка в одной кодировке (пусть даже это utf-8) в бинарном виде также сохранят свойство вхождение одной в другую. Или уже с этим возможны проблемы?

Alexander-Morozov Автор вопроса
Alexander Morozov
Я ожидаю, что подстрока и строка в одной кодировке...

нет-нет. Я тоже приводил всё к одному знаменателю, а потом уже сравнивал побайтово. Просто про этот нюанс отметил, не более чем как для информации

вариантов нет, но есть простор для оптимизации. в зависимости от длины шаблона первые итерации искать через sse/avx, а последние побайтно. за раз по 16/32/64 байт, или по 8/4/2 через scas

Alexander-Morozov Автор вопроса
Aiwan \ (•◡•) / _bot
вариантов нет, но есть простор для оптимизации. в ...

А при поиске через границы слова, двойного слова и т.п. проблемы не возникнет?

Да просто сконкатенируй строки и юзай z-функцию

Alexander-Morozov Автор вопроса
Alexander Morozov
Можно по-подробнее, непонятно!

Ну смотри, сложность построения z-массива линейная, таким образом сложность поиска подстроки в строке будет O(l1 + l2)

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
что насчет пагинга? на осдеве непонятно(
Vi Chapmann 🪙
25
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
64
Ребят, что лучше для реверса: гидра или ида?
En Vind Av Sorg
26
Делаю велосипед логгер. К сообщению хочу прикрутить некоторую информацию, типа, кем отправлено, какой уровень, и всякое такое. И тут подумалось мне, почему бы не хранить весь...
Serjone
24
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
если загрузчик efi? если сама PML4 PDPT PDT PT лежит в неудобном для меня месте?
Vi Chapmann 🪙
8
А я же правильно понимаю, что инструкция AT в ld только сохраняет метаинформации о том, куда загрузить сегмент, которую далее из эльфика читает grub(ну если граб)? Но я тогда ...
Evg Resh
2
Господа, импользую кастомный загрузчик, ядро запускается сразу в длинном режиме, хочу узнать, сколько всего физической ОЗУ есть у машины. И, может, знаете какие-то подводные к...
Vi Chapmann 🪙
6
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
Карта сайта