Похожие чаты

@Romshark Thirteen Thank you The challenge isn't parallelizing. The problem is

the difference between different websites!

For example, consider all of my websites are eCommerce and I want to grab the product price from these websites.
So what should I do?

Of course, Amazon has its own template, and Alibaba has its own! So I have to make it clear for my scrapper (the CSS selectors or regex or json unmarshal or...)

Now my current idea is: Add a function for each website, which accepts HTML doc and returns expected information from the website (for example product price)
But as I said, I don't think that it's a good plan!

Bcuz I have to add many functions to my program!
And when there is a new website, I should stop my program, then add a new function for a new website, build my program and run again!
Each time a new website needs to be added I should rebuild my program!

2 ответов

11 просмотров

or you could spend 10 years building a machine learning model which automatically scrapes websites no matter what layout it uses why build something for 30 minutes if you can automate it for 10 hours? 😂

Пользователь-61931 Автор вопроса

Any idea?

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Anyone knows where there are some instructions or discort about failed bridge transactions ?
Jochem
21
Also, why can’t the community have a vote/ say when it comes to initiatives like buybacks. Isn’t the point of crypto decentralisation? Don’t we deserve input as long term supp...
👨🏽‍🦰
13
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
Привет)) уже кажется эту тему перемусолили, но вот я так и не понял. Я сейчас сижу на 27дюймов 2к мониторе. На Актуальной макоси, если я куплю 27д 4к монитор: - будет ли изобр...
Vladislav Piskunov
15
any reference of this implementation?
BitBuddha
29
Hi guys, any problem with Pulsebrige? Trying to transfer from wETH to ETH. First it tells me to connect my metamask "through mobile app" not desktop. Then I did and confirmed ...
Snowflakecrypto
13
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Страшнейшая правда про списки ЦБ. С первых дней жизни P2P сферы, молодые человеки, начитавшись законодательной базы и "внутренних" документов, решили, что им противостоит сер...
Foxcool
3
Карта сайта