Похожие чаты

Привет! Столкнулся с проблемой в web scraper. На сайте 180

страниц пагинации, но иногда web scraper проходит только часть из них, скажем 10 или 50, и начинает уже просматривать страницы непосредственно с товарами. Иногда просматривает все 180 страниц пагинации. В параметрах Scrape увеличивал задержки вплоть до 10 секунд, не помогает. В чем может быть проблема, подскажите пожалуйста?

4 ответов

19 просмотров

- Частые запросы к серверу с одного ip - Если, данные все время подгружаются на страницу и страница НЕ очищается - может не хватать ресурсов ПК для построения DOM дерева и последующего его парсинга

Сергей- Автор вопроса
Andrey@inotoxic
- Частые запросы к серверу с одного ip - Если, дан...

Спасибо. Буду пробовать сначала задавать пагинацию по категориям товаров для уменьшения страниц пагинации

Сергей
Спасибо. Буду пробовать сначала задавать пагинацию...

Если , есть возможность отследить запрос отвечающий за подгрузку данных при переходе на страницу Через запросы с подстановкой параметров - собрать ссылки со страниц пагинаций

Сергей- Автор вопроса
Andrey@inotoxic
Если , есть возможность отследить запрос отвечающ...

Я до таких высот в парсинге еще не дошел :)

Похожие вопросы

Обсуждают сегодня

А кто-то пробовал, уезжая из Эстонии получить э-рез и продолжить вести предпринимательскую деятельность внутри Эстонии, используя свой OÜ?
Lalalashechki Lalala
62
@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
Чем оно проблема?
Nikita Uzumaki
21
@samkazemian - couple questions: Update on frxBTC? - This would do well with the current influx of institutional investment entering the space Update on future veFXS streams...
Costi
16
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Does anyone here have a connection Mullvad? it would be nice to know what it would take to have them accept BCH 0-conf.
tl121x
16
Can an XMR transaction be tracked from its sender to its receiver by performing blockchain analysis, no matter how many addresses are used?
Trkz342
16
I arrived here after a Chico Crypto show highlighted the project & the Team - the fact that the Team had a long history of successfully working with household names gave me e...
Banter is Bullish
5
Карта сайта