170 похожих чатов

Пишу асинхронный парсер для тестов чтобы потом в телеграм бота

запихнуть, в самих тестах идёт смесь текста и формул в картинках, и нормально спарсить через request и bs не выходит, я решил делать скринами через selenium, но selenium не асинхронный, я нашёл библиотеку aioselenium но для неё нужно запускать selenium server, а он жрёт много ОЗУ, подскажите что можно сделать? Может скрины другим способом делать или ещё что-то

27 ответов

38 просмотров

Ⓘ Данное сообщение доступно только пользователям Telegram 𝙋𝙧𝙚𝙢𝙞𝙪𝙢.

Я такую задачу решал регулярками.

Radzih- Автор вопроса
Денис Блажко
Я такую задачу решал регулярками.

Через регулярные выражения?, если да, то мне нужно чтобы текст и картинки были в правильном порядке

Radzih- Автор вопроса
Денис Блажко
Я такую задачу решал регулярками.

Пишу парсер на selenium который делает скриншоты и затем добавляет их в пдф, была первая версия где делал скриншот через библиотеку mss но тогда нужно было запускать не в режиме --headless, сейчас сделал скриншоты через driver.save_screenshot() и когда создаётся пдф через библиотеку fpdf, он делается намного медленнее с скриншотами через driver чем через mss, как можно ускорить процесс создания пдф, может другим способом скрины делать?

Radzih- Автор вопроса
Зомби Engineer🧟‍♂️🇷🇸
pdf чисто из скриншотов?

Ну там строчка текста, потом скрин

Radzih- Автор вопроса
Radzih
Не понял

В лс пришли ссылку на codepen

Radzih- Автор вопроса
Radzih- Автор вопроса
Зомби Engineer🧟‍♂️🇷🇸
ага, понятно

Чисто парсить не получится, потому что там в вопросах могут быть картинки с формулами

Radzih
Чисто парсить не получится, потому что там в вопро...

ну тут чтоб ускорить можно для начала от хрома отказаться

Radzih- Автор вопроса
Зомби Engineer🧟‍♂️🇷🇸
тоже слон. webview

Он подойдёт так как мне ещё там авторизоваться надо?

Radzih- Автор вопроса
Radzih- Автор вопроса
Radzih
Пример

Сначала была идея написать телеграм бота на aiogram но парсер сам то не асинхронный и на селениум асинхронный не сделаешь, а через request, я не знаю что делать если в вопросе будут картинки, решил я написать на telebot бота чисто для себя

Radzih
Пишу парсер на selenium который делает скриншоты и...

Я в работе с пдф не силён. Мне скинули ссылку на сайт, я тебе отправлял. Я её изучил и нашёл ответ к конкретно моей задаче

Radzih- Автор вопроса
Radzih- Автор вопроса
Radzih
Пробую и мне выдаёт

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта