запихнуть, в самих тестах идёт смесь текста и формул в картинках, и нормально спарсить через request и bs не выходит, я решил делать скринами через selenium, но selenium не асинхронный, я нашёл библиотеку aioselenium но для неё нужно запускать selenium server, а он жрёт много ОЗУ, подскажите что можно сделать? Может скрины другим способом делать или ещё что-то
Ⓘ Данное сообщение доступно только пользователям Telegram 𝙋𝙧𝙚𝙢𝙞𝙪𝙢.
Я такую задачу решал регулярками.
Через регулярные выражения?, если да, то мне нужно чтобы текст и картинки были в правильном порядке
https://habr.com/ru/post/349860/
Пишу парсер на selenium который делает скриншоты и затем добавляет их в пдф, была первая версия где делал скриншот через библиотеку mss но тогда нужно было запускать не в режиме --headless, сейчас сделал скриншоты через driver.save_screenshot() и когда создаётся пдф через библиотеку fpdf, он делается намного медленнее с скриншотами через driver чем через mss, как можно ускорить процесс создания пдф, может другим способом скрины делать?
pdf чисто из скриншотов?
Ну там строчка текста, потом скрин
Ожиданий поди много?
Не понял
В лс пришли ссылку на codepen
codepen это типа pastebin?
ага, понятно
Чисто парсить не получится, потому что там в вопросах могут быть картинки с формулами
ну тут чтоб ускорить можно для начала от хрома отказаться
тоже слон. webview
Он подойдёт так как мне ещё там авторизоваться надо?
Сначала была идея написать телеграм бота на aiogram но парсер сам то не асинхронный и на селениум асинхронный не сделаешь, а через request, я не знаю что делать если в вопросе будут картинки, решил я написать на telebot бота чисто для себя
Я в работе с пдф не силён. Мне скинули ссылку на сайт, я тебе отправлял. Я её изучил и нашёл ответ к конкретно моей задаче
Пробую и мне выдаёт
UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
Обсуждают сегодня