170 похожих чатов

Привет! Мне нужно проверить нет ли в тексте недопустимых html-тегов.

Я допёр пока только до такой регулярки:
<(p|span|em|strong|ol|ul|li)(\s.*?)?>
. Она находит те теги, которые можно. Осталось как-то инвертировать эти теги и все будет работать. Помогите пожалуйста, как это сделать?
https://regex101.com/r/gV1EQQ/1

15 ответов

2 просмотра

Так если надо проверить нет ли их, что мешает проверить есть ли они и сделать !

Совет: не используй регулярки для парсинга html) Я ведь могу например написать <a url="<notAllowedTag/>"/> и твоя прога будет говорить, мол, недопустимый тег

А может лучше список допустимых тегов, и не регулярками, а предназначенными для этого инструментами? https://github.com/mganss/HtmlSanitizer

Alex- Автор вопроса
Andrew Shurunov
Совет: не используй регулярки для парсинга html) Я...

У меня на сайте есть встроенный редактор текста, с помощью него можно максимум сделать текст жирным и сделать нумерованный список. Там по идее не должно быть таких случаев

Alex- Автор вопроса
SomebodyOdd
А может лучше список допустимых тегов, и не регуля...

Хмм, сейчас гляну, но что-то мне неохота для такой задачки либу тянуть

Alex
У меня на сайте есть встроенный редактор текста, с...

Иногда регулярки можно юзать для html, если задача совсем простая. Но часто на такие вопросы кидают культовый ответ: https://stackoverflow.com/a/1732454/5055884

Alex
Хмм, сейчас гляну, но что-то мне неохота для такой...

А парсить иерархические структуры не предназначенными для этого регулярками - это, значит, хочется? =)

Alex- Автор вопроса
Alex- Автор вопроса
SomebodyOdd
А парсить иерархические структуры не предназначенн...

А мне и не надо иерархическую структуру парсить))

Alex
А мне и не надо иерархическую структуру парсить))

Судя по описанию редактора - надо предотвратить нехорошие теги в том, что приходит потом бекенду. Это регулярками надёжно не закрывается - либо будет пропускать, либо будет ложно срабатывать. Пожалуйста, ради рассудка того, кто потом будет это кроме вас читать и поддерживать, притяните либу и не страдайте регулярками для html =)

Alex- Автор вопроса
SomebodyOdd
Судя по описанию редактора - надо предотвратить не...

Хорошо, спасибо за совет, сейчас посмотрю что там за либа))

Alex
Хорошо, спасибо за совет, сейчас посмотрю что там ...

Простой System.Xml.Document справится Им правда не очень удобно пользоваться, так что лучше глянь либу

Andrew Shurunov
Простой System.Xml.Document справится Им правда не...

Вряд ли им можно надёжно разобрать HTML, увы.

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Добрый день, чат. Мне в очередь из других RabbitMQ по shovel валятся метрики в формате текста для Prometheus. Помогите пожалуйста подружить RabbitMQ и Prometheus, чтобы он (...
Aleksey
4
@ahndmn @ayaw0_0 здарова, на чем пишете?
Aiwan \ (•◡•) / _bot
7
Карта сайта