170 похожих чатов

Пишу асинхронный парсер для тестов чтобы потом в телеграм бота

запихнуть, в самих тестах идёт смесь текста и формул в картинках, и нормально спарсить через request и bs не выходит, я решил делать скринами через selenium, но selenium не асинхронный, я нашёл библиотеку aioselenium но для неё нужно запускать selenium server, а он жрёт много ОЗУ, подскажите что можно сделать? Может скрины другим способом делать или ещё что-то

27 ответов

24 просмотра

Ⓘ Данное сообщение доступно только пользователям Telegram 𝙋𝙧𝙚𝙢𝙞𝙪𝙢.

Я такую задачу решал регулярками.

Radzih- Автор вопроса
Денис Блажко
Я такую задачу решал регулярками.

Через регулярные выражения?, если да, то мне нужно чтобы текст и картинки были в правильном порядке

Radzih- Автор вопроса
Денис Блажко
Я такую задачу решал регулярками.

Пишу парсер на selenium который делает скриншоты и затем добавляет их в пдф, была первая версия где делал скриншот через библиотеку mss но тогда нужно было запускать не в режиме --headless, сейчас сделал скриншоты через driver.save_screenshot() и когда создаётся пдф через библиотеку fpdf, он делается намного медленнее с скриншотами через driver чем через mss, как можно ускорить процесс создания пдф, может другим способом скрины делать?

Radzih- Автор вопроса
Зомби Engineer🧟‍♂️🇷🇸
pdf чисто из скриншотов?

Ну там строчка текста, потом скрин

Radzih- Автор вопроса
Radzih
Не понял

В лс пришли ссылку на codepen

Radzih- Автор вопроса
Radzih- Автор вопроса
Зомби Engineer🧟‍♂️🇷🇸
ага, понятно

Чисто парсить не получится, потому что там в вопросах могут быть картинки с формулами

Radzih
Чисто парсить не получится, потому что там в вопро...

ну тут чтоб ускорить можно для начала от хрома отказаться

Radzih- Автор вопроса
Зомби Engineer🧟‍♂️🇷🇸
тоже слон. webview

Он подойдёт так как мне ещё там авторизоваться надо?

Radzih- Автор вопроса
Radzih- Автор вопроса
Radzih
Пример

Сначала была идея написать телеграм бота на aiogram но парсер сам то не асинхронный и на селениум асинхронный не сделаешь, а через request, я не знаю что делать если в вопросе будут картинки, решил я написать на telebot бота чисто для себя

Radzih
Пишу парсер на selenium который делает скриншоты и...

Я в работе с пдф не силён. Мне скинули ссылку на сайт, я тебе отправлял. Я её изучил и нашёл ответ к конкретно моей задаче

Radzih- Автор вопроса
Radzih- Автор вопроса
Radzih
Пробую и мне выдаёт

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Карта сайта