Добрый день! Подскажите, есть ли на примете у кого-нибудь

Question

Добрый день! Подскажите, есть ли на примете у кого-нибудь

качественные учебные материалы по веб скрапингу?
Моя проблема состоит в том, что на сайте меняется порядок характеристик ноутбуков или же иногда что-то отсутствует (например, на фото у одного ноута указан тип экрана, а у другого нет, то же самое касается камеры).
Я не могу сообразить, как такие условия прописывать в коде.

#programming #r #russian

0

12.08.2021

10 ответов

39 просмотров

aGricolaMZ

Но вообще все зависит от кода страницы... По скрину ничего не понять

0

12.08.2021

Ekaterina Автор вопроса

aGricolaMZ
Но вообще все зависит от кода страницы... По скрин...

1 фото https://rozetka.com.ua/acer_nx_hzreu_01s/p282342578/characteristics/ 2 фото https://rozetka.com.ua/asus-90nb0l61-m15620/p305995863/characteristics/

0

12.08.2021

aGricolaMZ

Ekaterina
1 фото https://rozetka.com.ua/acer_nx_hzreu_01s/p2...

ну, авторы сайта не снадбили каждую характеристику отдельным классом, так что Вам придется решать задачу регулярками...

0

12.08.2021

Ekaterina Автор вопроса

да, это я и обнаружила, поэтому написала сюда. Думала, может есть пример, как в такой ситуации писать код.

0

12.08.2021

Ed P

Парсить другой более адекватный сайт?

0

12.08.2021

Ekaterina Автор вопроса

не вариант

0

12.08.2021

Ed P

Ну тогда регулярки. Тут же в принципе характеристики подписаны, даже если для них CSS классов нормальных не задано

0

12.08.2021

Dmitry Khramov

Из очень старенького, но может ещё пригодиться... http://dkhramov.dp.ua/Stu.WebMining.html

0

12.08.2021

Dmitry Khramov

А в чем собственно проблема? Собираете пары "имя - значение", складываете у себя и делаете с ними что хотите. Для одного ноута: library(rvest) hdoc <- read_html("https://rozetka.com.ua/acer_nx_hzreu_01s/p282342578/characteristics/") label <- html_elements(hdoc, xpath = "//dt[@class='characteristics-full__label']") %>% html_text() value <- html_elements(hdoc, xpath = "//dd[@class='characteristics-full__value']") %>% html_text()

0

12.08.2021

aGricolaMZ · Accepted Answer

aGricolaMZ

полно... мы с @pozdniakovivan в какой-то момент делали на воскресном скринкасте.

0

12.08.2021

169 похожих чатов

Добрый день! Подскажите, есть ли на примете у кого-нибудь

10 ответов

Похожие вопросы