основе его статьй новый сайт-каталог. Может кто помочь с парсингом?
Создать хочу по простому на WordPress (https://hgmdev.ru/)
Спарсить все статьи отсюда (https://delphiworld.narod.ru)
Если кто-то поможет и скинет бд с данными (название статьи, содержание, можно и автора), то будет супер быстро.
Я знаю, что статьи там уже давно попахивают, но можно их редактировать (и их нужно будет редактировать), но основа будет не плохая. Ну а дальше публиковать можно кому угодно.
что по этому поводу говорит автор сайта?
Не отвечает
Так есть же архив(зачем парсить?) и овердофига зеркал.
Я хочу не просто зеркалить, а спарсить как базу для новой базы знаний
Так парси архив. Там и индекс есть. И структура HTML почище. Я искал по нему локально.
Позже пришлю
Сейчас это у меня выглядит так. 35Мб Почтой или ссылкой на диск могу прислать.
На диск ссылку норм
В некоторых статьях есть картинки, их отдельно выгружать?
Они там обычно полуголых баб вставляют
Но если есть что-то полезное для статьи, то можно выгрузить отдельно
телепорт
Это как раз тот случай, когда не стоит делать на IE. за то как его всем выпаривали в 20XX 😁
Это как раз до 2004г, когда было нормой.
https://drive.google.com/file/d/1b7y0td8sAGy4_5n_cjqf0bzMGVoF1yMs/view https://mega.nz/file/i0ZBXI6K#5zgdBpAT0-XueSFyBkXi2k25BVH7Y-CfbUHvjyutcB8
тут по-новее от 15.08.2005: https://mega.nz/file/BLMzCJjT#FlGtHwEKJVxNkzUTpsbEvTQU-yqWyxksXnLFQMkfEy8
Отличается на 8 tips, остальное вообще не существенное, но ok. Где раньше был?
Обсуждают сегодня