169 похожих чатов

Нужно парсить сайт. Возможно на нем есть защита от парсинга. Какие

есть технологии, чтобы условно сайт загружался и работал как JS приложение на сервере, отправлял запросы и тд, те вел себя также как обычный барузерный клиент? И соответсвенно, чтобы какие то запросы я мог парсить

15 ответов

27 просмотров

puppeteer

Sergey Fetch(Феч)
puppeteer

Ну это ведь и есть клиент chronium?

selenium

Sergey Kulikov
Ну это ведь и есть клиент chronium?

я не знаю что такое chronium, знаю ток chromium

Владимир-Наваев Автор вопроса
Sergey Kulikov
Ну это ведь и есть клиент chronium?

Да, наверное лучше всего - это обертка над chromium

Владимир-Наваев Автор вопроса
Sergey Fetch(Феч)
puppeteer

Пока не пойму может ли эта штука полностью эмулировать работу. Те будет ли например посылать запросы по таймаутам JS SPA приложения?

Владимир-Наваев Автор вопроса
Sergey Fetch(Феч)
какие запросы? на апишку?

Ну не важно. Типо того, из те запросы которые создает JS браузерное приложение

Владимир Наваев
Ну не важно. Типо того, из те запросы которые созд...

ниче не понятно, пупитер это обертка над хромиумом.

Владимир-Наваев Автор вопроса
Sergey Fetch(Феч)
ниче не понятно, пупитер это обертка над хромиумом...

Ну крч, вот есть SPA приложение, которое дергает какую-то апишку раз в секунду. Пупитер соответственно скачает эту страничку и начнет полностью эмулировать ее работу? Те например посылать теже запросы?

Владимир Наваев
Ну крч, вот есть SPA приложение, которое дергает к...

Он берет и открывает страницу хромиумом с подключением к браузерному протоколу девтулзов. Если в коде страницы есть скрипты, отправляющие запросы, то хромиум их выполнит. А ещё его можно заставить ждать селекторов, кликать по ним, эмулировать драг, делать скриншоты и дофига чего ещё

Владимир-Наваев Автор вопроса
Светлана Чайка с Голубятни
Он берет и открывает страницу хромиумом с подключе...

Да, кул. Ща как раз читаю про это. Но то, что я хочу это избежать обнаружение моего бота. Оказывается есть куча мелких деталей из-за который какой-нить selenium быстро вычисляют. Те он не полностью эмулирует работу

Владимир Наваев
Да, кул. Ща как раз читаю про это. Но то, что я х...

Так сейчас вокруг темы отличия робота от юзера огромные деньги из рекламных бюджетов крутятся, так что там уже алгоритмы вплоть до сравнения скорости, траектории движения курсора и всего такого)))

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта