В трех потоках. В каждом сессия создается, рандомный прокси и определённая категория. Но я все равно ловлю 429й статус код.
Подскажите, как это обойти?
Если код 429, то я обновляю сессию и новый прокси туда ж пихаю. Куки от меня пустые.
Что я не так делаю?
Я бы хотел обойти ошибку не сном, а сменой ip
В заголовках нет подсказки, насколько я обнаглел и сколько нужно подождать.
Я и так сплю от 10 до 100 секунд примерн перед каждым реквестом
@Tishka17 проконсультируешь любителя парсинга?
Привет, дополните пожалуйста ответы на вопросы : Меняете ли заголовки? Прокси на валид чекаете? Парсинг через requests или selenium, либо ещё что-то ?
Извиняюсь, забыл указать, там в цикле происходит обновление прокси и только суп с реквестом. Я не профи, надеюсь, код не слишком кошмарный https://dpaste.com/DGDYAGZTP в функции load_page происходит обновление
Не надо менять прокси. Взял один и юзай всегда. А скорее всего вообще без прокси можно
Я подумал, чтоб не заблочили ip
чтобы не заблочили по айпи надо условия использования сайта не нарушать
надо.если с одного прокси делать запросы,выдаст капчу(код 429),либо делать паузы между запросами,но парсить будет медленно.ему как я понял нужна именно скорость(в коде multiprocessing используется )
ну значит пусть парсит медленно
Обсуждают сегодня