170 похожих чатов

Привет) Я вот пытаюсь спарсить с сайта разные категории товаров.

В трех потоках. В каждом сессия создается, рандомный прокси и определённая категория. Но я все равно ловлю 429й статус код.
Подскажите, как это обойти?
Если код 429, то я обновляю сессию и новый прокси туда ж пихаю. Куки от меня пустые.
Что я не так делаю?

Я бы хотел обойти ошибку не сном, а сменой ip
В заголовках нет подсказки, насколько я обнаглел и сколько нужно подождать.
Я и так сплю от 10 до 100 секунд примерн перед каждым реквестом

8 ответов

9 просмотров

@Tishka17 проконсультируешь любителя парсинга?

Привет, дополните пожалуйста ответы на вопросы : Меняете ли заголовки? Прокси на валид чекаете? Парсинг через requests или selenium, либо ещё что-то ?

>>>- Автор вопроса

Извиняюсь, забыл указать, там в цикле происходит обновление прокси и только суп с реквестом. Я не профи, надеюсь, код не слишком кошмарный https://dpaste.com/DGDYAGZTP в функции load_page происходит обновление

>>>
Извиняюсь, забыл указать, там в цикле происходит о...

Не надо менять прокси. Взял один и юзай всегда. А скорее всего вообще без прокси можно

>>>- Автор вопроса
>>>
Я подумал, чтоб не заблочили ip

чтобы не заблочили по айпи надо условия использования сайта не нарушать

Tishka17
Не надо менять прокси. Взял один и юзай всегда. А ...

надо.если с одного прокси делать запросы,выдаст капчу(код 429),либо делать паузы между запросами,но парсить будет медленно.ему как я понял нужна именно скорость(в коде multiprocessing используется )

Похожие вопросы

Обсуждают сегодня

Типа вызывать GetParent и проверять на соответствие GetModuleHandle?
The Bird of Hermes
67
Всем привет! Кто нибудь парсил в ручную JSON без библиотек и фреймворков? Есть может ссылки на оптимальный алгоритмы работы с текстом и примеры таких парсеров?
Lem
27
Do any of you guys have interesting projects one could join? I'm a Middle Full-Stack developer (JS/TS, React & Node)
Lev Shapiro
40
Есть сайт. Там была древняя версия эво. Стоял плагин, который каждый коммент в Jot делал отдельной страницей. После обновления все слетело, теперь старница открывается отдельн...
Artem
1
$res = json_decode($наша строка из респонса); $res1 = array_map(fn($o) => $o->name, $res->breadcrumbs[0]->entities); Как такое будет на Хаскеле?.. В начале весь джейсон, в ко...
Хаскель Моисеевич Гопник
27
Добрый день. А shovel'ы можно как-то сконфигурировать в definitions.json? Пробовал что-то вроде: { "users": [ { "name": "agent", "password_hash": "RBCbTzQd...
Aleksey
1
Вопрос по диагностике ошибок (я знаю в чем, в данном конкретном примере, я знаю, как исправить, пример модельный, понятно, что в реальности бывает намного запутаннее). module...
ⰄⰎⰋⰐⰐⰑⰛⰤⰧⰧⰩⰄ ⰊⰑⰁⰓⰡⰛⰦⰕⰫ
11
А чем вам питонисты не угодили?😂
.
79
В чем сила брат, в NASM или FASM?
Isaac Kleiner
18
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
52
Карта сайта