170 похожих чатов

Import requests from selenium import webdriver from bs4 import BeautifulSoup from time import

sleep
from concurrent.futures import ProcessPoolExecutor
from concurrent.futures import as_completed

options = webdriver.ChromeOptions()
options.add_argument('--headless')
driver = webdriver.Chrome(options=options)

base_url = 'https://auto.ria.com/search/?indexName=auto,order_auto,newauto_search&price.currency=&abroad.not=0&custom.not=1&page=0&size=100'

driver.get(base_url)
main_page = driver.page_source
soup = BeautifulSoup(main_page, 'lxml')
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
sleep(3)
pages = driver.find_element_by_xpath('//*[@id="searchPagination"]/div/nav/span[9]').text.replace(' ', '')
links = []
liks_otzv = []
def parse_1():
for i in range(10):
if i == 0:
continue
url = 'https://auto.ria.com/search/?indexName=auto,order_auto,newauto_search&price.currency=&abroad.not=0&custom.not=1&page=' + str(
i) + '&size=100'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
items = soup.findAll('section', class_='ticket-item')
for item in items:
link = item.find('a').get('href')
if link == 'javascript:void(0)':
continue
links.append(link)
print(len(items))
print(str(i))
parse_1()

def square(link):
r = requests.get(link)
soup = BeautifulSoup(r.content, 'lxml')
print(link)
try:
link_otzv = soup.find('div', class_='allotted i-block').find('a').get('href')
except:
try:
link_otzv = 'https://auto.ria.com' + soup.find('div', class_='testimonials_full_wrap').find('a').get('href')
except:
link_otzv = ''
liks_otzv.append(link_otzv)


if name == 'main':
with ProcessPoolExecutor(max_workers=3) as executor:
results = executor.map(square, links)

print(links_otzv)

1 ответов

11 просмотров

Удали и зайди нормально (pastebin)

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта