есть технологии, чтобы условно сайт загружался и работал как JS приложение на сервере, отправлял запросы и тд, те вел себя также как обычный барузерный клиент? И соответсвенно, чтобы какие то запросы я мог парсить
puppeteer
Ну это ведь и есть клиент chronium?
selenium
я не знаю что такое chronium, знаю ток chromium
Да, наверное лучше всего - это обертка над chromium
Пока не пойму может ли эта штука полностью эмулировать работу. Те будет ли например посылать запросы по таймаутам JS SPA приложения?
какие запросы? на апишку?
Ну не важно. Типо того, из те запросы которые создает JS браузерное приложение
ниче не понятно, пупитер это обертка над хромиумом.
Ну крч, вот есть SPA приложение, которое дергает какую-то апишку раз в секунду. Пупитер соответственно скачает эту страничку и начнет полностью эмулировать ее работу? Те например посылать теже запросы?
че хочешь то и делаешь.
Он берет и открывает страницу хромиумом с подключением к браузерному протоколу девтулзов. Если в коде страницы есть скрипты, отправляющие запросы, то хромиум их выполнит. А ещё его можно заставить ждать селекторов, кликать по ним, эмулировать драг, делать скриншоты и дофига чего ещё
Да, кул. Ща как раз читаю про это. Но то, что я хочу это избежать обнаружение моего бота. Оказывается есть куча мелких деталей из-за который какой-нить selenium быстро вычисляют. Те он не полностью эмулирует работу
Так сейчас вокруг темы отличия робота от юзера огромные деньги из рекламных бюджетов крутятся, так что там уже алгоритмы вплоть до сравнения скорости, траектории движения курсора и всего такого)))
Обсуждают сегодня