WB?
я чуть больше 38 млн собираю с учетом размеров
Спасибо за ответ! Мне казалось, что там побольше товаров (порядка 70 млн) А за какое время собираешь такой объем?
Мне тоже кажется, что там больше. Но нужно тестировать подходы с разных сторон, что бы обходить лимиты на выдачу товаров. Хз, может быть за часов 15
Офигеть. Не банят? Сколько прокси или задержка?
ВБ не сложный в плане парсинга, но свои нюансы есть)
Кстати там один товар может быть в разных категориях, поэтому общее количество всех товаро-размеров больше 92млн у меня выходит.
По ID они совпадают?
Да, есть такое. Я имел ввиду уникальные товары Есть ли какой-то способ сразу парсить уникальные товары? Не проверяя дубли из хранилища
Ну, как бы да..
нельзя, в смысле - парсить без дублей.
Согласен, просишь всё. И уникальные только в базе данных уже группируешь.
В ссылке же nm_id, есть, разве нет? Проверили - если nm_id уже есть в базе, не нужно парсить, только отметить что в этой категории есть
ну, это то что бы "Есть ли какой-то способ сразу парсить уникальные товары? Не проверяя дубли из хранилища". Это как раз с проверкой на дубли 🙃
при этом парсить то их не нужно 🤷♂️
Перебором id? )
Это тип задать допустимый пулл/границы id и их парсить?
Обсуждают сегодня