170 похожих чатов

/<\/?([A-Z]+)\S*[^>]*>/Gmi Ребят, мне нужо из XML/HTML тегов, вытащить их нейминг. Набросал

регулярку. На regex101 работает, матчит правильно, а в самой ноде — нет. В чем проблема?

В ноде выводит <...> такие паттерны

17 ответов

21 просмотр

Чому бы не взять xml парсер?

Ivan-K. Автор вопроса

Задача написать свой xml-парсер

На регулярках? 🤨

Ivan-K. Автор вопроса

Как угодно, но самостоятельно. Есть идеи лучше, чем регулярки, чтобы уметь читать емкие файлы ~500MB?

Fsm

Ivan-K. Автор вопроса

FSM? Как?)

Если ты так и не сподобился почитать про sax, о котором тебе несколько человек писали, то тогда почитай про конечные автоматы

Лучше не регулярки, а циклом перебирать, посмотри как работает парсер js кода

Что как? Как сделать fsm? Спроси гугл

Ivan-K. Автор вопроса

Искал. Но ничего не понял/толком не нашел. Конечные автоматы. Я даже не понимаю как ими написать реализацию. В целом, я читаю построчно. Моя задача: Найти в каждой строке открывающийся тэг, закрывающийся и данные каждого тега. Даже не смотрим на атрибуты и исключил пока хэндлер ошибок. Потом сделаю стек, в который кидаю название тэга, вытягиваю, когда он закрывается, ака решаю задачу скобочек ({)}

Ivan-K. Автор вопроса

Я не понимаю что значит перебирать циклом. У меня в любом случае построчное чтение

Просто отправили человека в дискретную математику

Так может, стоит разобраться? Тебе вон и код показали, где это реализовано. Можно же изучить этот код

Ivan-K. Автор вопроса

Там непонятный для меня спагетти-код, честно

Ну посмотри со стороны на свои попытки: про сакс читал, с ходу не понял, решил не углубляться; код не разобрал, решил не углубляться Чего ты ждёшь от ответов? Вряд ли кто-то впишется в то, чтобы разжёвывать тебе всё как школьнику. Стоит самому приложить усилия, мне кажется. Направление, в котором копать, тебе дали

Написать нормальный ast парсер

Эт че все один тип так долго страдает?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта