170 похожих чатов

Есть список (список доменов) который надо обработать. Также есть обработчики

(n-е количестов) которые могут обработать домен и вернуть результат, у обработчика есть количестов раз, сколько доменов он может обработать всего (50) и после каждой обработки он должен засыпать на 5 секунд. Как лучше реализовать это, чтоб паралельно работали все обработчики? Можно ли это реализовать с помощью ThreadPoolExecutor. Сделал такую реализацию(не самую удачную), но я думаю это можно намного проще реализовать, но не знаю как https://gist.github.com/djigit0s/461880b3e6825db57ffed62f7e670132

domains = ['aa.com', 'bb.com', 'cc.com',
'dd.com', 'ee.com', 'ff.com', 'gg.com']
workers = [
{
'id': 1,
'attempt': 98,
'is_locked': False,
'status': 'ready'
},
{
'id': 2,
'attempt': 60,
'is_locked': False,
'status': 'ready'
},
]

15 ответов

14 просмотров
djigit0s- Автор вопроса

@Tishka17 посоветуй что-нибудь

что значит "обработать домены"?

djigit0s- Автор вопроса
Tishka17
что значит "обработать домены"?

я для примера сделал функцию которая приписывает http, реальная задача получить данные с сайта

djigit0s- Автор вопроса

может есть идеи как сделать лучше?

djigit0s- Автор вопроса

@Tishka17 не посоветуешь ничего?

djigit0s
@Tishka17 не посоветуешь ничего?

Посветую почитать соглашения всех сайтов

djigit0s- Автор вопроса
Tishka17
Посветую почитать соглашения всех сайтов

а каким образом это относится к коду?

djigit0s
а каким образом это относится к коду?

Предположительно сильно сократится количество сайтов

djigit0s- Автор вопроса
Tishka17
Предположительно сильно сократится количество сайт...

это же никак не повлияет на код, данный код можно применить к любой другой задаче, необязательно к парсингу

djigit0s
это же никак не повлияет на код, данный код можно ...

если твои обработчики много ходят в сеть, то тебе нужно смотреть в сторону asyncio, если нет, и ты хочешь распаралелить, то тебе нужен мультипроцессинг а тишка имел ввиду то, что соглашение сайтов многих запрещает автоматизированный сбор информации, соответственно обсуждение этого в чате запрещено п.6 правил чата

djigit0s- Автор вопроса
Ruslan Chernenko
если твои обработчики много ходят в сеть, то тебе ...

на многих сайтах этого соглашения, в котором говорится о запрете нету в принципе, да и в коде не указаны сайты, @Tishka17 если бы я написал, что задача заключается в другом, а не в парсинге сайтов это изменило что либо?

djigit0s- Автор вопроса
djigit0s- Автор вопроса

ребята посоветуйте как сделать лучше и правильнее?

djigit0s- Автор вопроса

???????

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
Коллеги, доброе утро. Запустил на удаленном хосте приложение (ручками зашел туда по ssh и запустил, не командой удаленно). Создал потом ssh-туннель, и с моей машины приложение...
Δημήτηρ
9
Карта сайта