данные он не совсем корректно, как его найти (исходник). Часть новостей выводится с тегами внутри текста новости, а часть новостей выводится без "<" ">", получается тарабарщина, когда я паршу фид этого сайта, как можно и лучше поправить?
Т.е. что я имею в виду последние новости выводятся с такими тегами: <p>, а часть так <p>, меня это не устраивает
Предварительно через html_entity_decode() можно? Я понимаю, что это не решение причины, а борьба со следствием, но как бы все равно же парсишь.
Зайти в сами проблемные новости и посмотреть тип анонса?
паршу на питоне bs4, при преобразовании в объект парсера соответственно уже не получается сделать аналог html_entity_decode(), можно сам на сам получаемый xml прокинуть преобразование, но часть новостей потом пропадает
если непосредственно в проблемную новость провалиться, то там html разметка прописана явно, в нормальных новостях же я так понимаю новость записана средствами редактора, как бы менять новости за последние 9 лет руками, такое себе удовольствие
Последую примеру Понтия Пилата
кого приговорили?:D
или "умываете руки"?
Уф, сложнота)
Обсуждают сегодня