Господа приветствую, подскажите. на сайте есть rss блок, но отдает

Question

Господа приветствую, подскажите. на сайте есть rss блок, но отдает

данные он не совсем корректно, как его найти (исходник). Часть новостей выводится с тегами внутри текста новости, а часть новостей выводится без "<" ">", получается тарабарщина, когда я паршу фид этого сайта, как можно и лучше поправить?

#1c #bitrix #cms #programming #russian #software

0

07.12.2021

10 ответов

40 просмотров

Алексей Автор вопроса

Т.е. что я имею в виду последние новости выводятся с такими тегами: <p>, а часть так <p>, меня это не устраивает

0

07.12.2021

Eugene Zhukov

Зайти в сами проблемные новости и посмотреть тип анонса?

0

07.12.2021

Алексей Автор вопроса

Dao Cat
Предварительно через html_entity_decode() можно? Я...

паршу на питоне bs4, при преобразовании в объект парсера соответственно уже не получается сделать аналог html_entity_decode(), можно сам на сам получаемый xml прокинуть преобразование, но часть новостей потом пропадает

0

07.12.2021

Алексей Автор вопроса

Eugene Zhukov
Зайти в сами проблемные новости и посмотреть тип а...

если непосредственно в проблемную новость провалиться, то там html разметка прописана явно, в нормальных новостях же я так понимаю новость записана средствами редактора, как бы менять новости за последние 9 лет руками, такое себе удовольствие

0

07.12.2021

Eugene Zhukov

Алексей
если непосредственно в проблемную новость провалит...

Последую примеру Понтия Пилата

0

07.12.2021

Алексей Автор вопроса

Eugene Zhukov
Последую примеру Понтия Пилата

кого приговорили?:D

0

07.12.2021