Так если надо проверить нет ли их, что мешает проверить есть ли они и сделать !
Совет: не используй регулярки для парсинга html) Я ведь могу например написать <a url="<notAllowedTag/>"/> и твоя прога будет говорить, мол, недопустимый тег
А может лучше список допустимых тегов, и не регулярками, а предназначенными для этого инструментами? https://github.com/mganss/HtmlSanitizer
эту задачу можно отнести к парсингу?
У меня на сайте есть встроенный редактор текста, с помощью него можно максимум сделать текст жирным и сделать нумерованный список. Там по идее не должно быть таких случаев
Хмм, сейчас гляну, но что-то мне неохота для такой задачки либу тянуть
Иногда регулярки можно юзать для html, если задача совсем простая. Но часто на такие вопросы кидают культовый ответ: https://stackoverflow.com/a/1732454/5055884
А парсить иерархические структуры не предназначенными для этого регулярками - это, значит, хочется? =)
Ого там сердечек сколько
А мне и не надо иерархическую структуру парсить))
Судя по описанию редактора - надо предотвратить нехорошие теги в том, что приходит потом бекенду. Это регулярками надёжно не закрывается - либо будет пропускать, либо будет ложно срабатывать. Пожалуйста, ради рассудка того, кто потом будет это кроме вас читать и поддерживать, притяните либу и не страдайте регулярками для html =)
Хорошо, спасибо за совет, сейчас посмотрю что там за либа))
Простой System.Xml.Document справится Им правда не очень удобно пользоваться, так что лучше глянь либу
Вряд ли им можно надёжно разобрать HTML, увы.
Обсуждают сегодня