169 похожих чатов

Добрый день! Подскажите, есть ли на примете у кого-нибудь

качественные учебные материалы по веб скрапингу?
Моя проблема состоит в том, что на сайте меняется порядок характеристик ноутбуков или же иногда что-то отсутствует (например, на фото у одного ноута указан тип экрана, а у другого нет, то же самое касается камеры).
Я не могу сообразить, как такие условия прописывать в коде.

10 ответов

19 просмотров

полно... мы с @pozdniakovivan в какой-то момент делали на воскресном скринкасте.

Но вообще все зависит от кода страницы... По скрину ничего не понять

Ekaterina- Автор вопроса
aGricolaMZ
Но вообще все зависит от кода страницы... По скрин...

1 фото https://rozetka.com.ua/acer_nx_hzreu_01s/p282342578/characteristics/ 2 фото https://rozetka.com.ua/asus-90nb0l61-m15620/p305995863/characteristics/

Ekaterina
1 фото https://rozetka.com.ua/acer_nx_hzreu_01s/p2...

ну, авторы сайта не снадбили каждую характеристику отдельным классом, так что Вам придется решать задачу регулярками...

Ekaterina- Автор вопроса

да, это я и обнаружила, поэтому написала сюда. Думала, может есть пример, как в такой ситуации писать код.

Парсить другой более адекватный сайт?

Ekaterina- Автор вопроса

не вариант

Ну тогда регулярки. Тут же в принципе характеристики подписаны, даже если для них CSS классов нормальных не задано

Из очень старенького, но может ещё пригодиться... http://dkhramov.dp.ua/Stu.WebMining.html

А в чем собственно проблема? Собираете пары "имя - значение", складываете у себя и делаете с ними что хотите. Для одного ноута: library(rvest) hdoc <- read_html("https://rozetka.com.ua/acer_nx_hzreu_01s/p282342578/characteristics/") label <- html_elements(hdoc, xpath = "//dt[@class='characteristics-full__label']") %>% html_text() value <- html_elements(hdoc, xpath = "//dd[@class='characteristics-full__value']") %>% html_text()

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта