170 похожих чатов

Еще один вопрос по многопоточности. Я правильно структуирую многопоточный код?

Просто, даже в 4 потоках(включая основной) прирост в скорости лишь х2(если сравнивать с одним потоком). На парсинг 40 страниц(разбил на каждый поток по 40 страниц) уходит около 30 секунд(в одном потоке), на парсинг 200 страниц в 4 потоках 90 секунд. В одном потоке парсинг 200 страниц 200 секунд

17 ответов

6 просмотров

Парсинг, наверное, тяжелый, и ты упираешься в GIL. Может тебе стоит перепрыгнуть на многопроцессинг.

Assa-Byn Автор вопроса
Oskar Sharipov
Парсинг, наверное, тяжелый, и ты упираешься в GIL....

попробовал, результат почти тот же, те же 90-100 секунд. Скорее всего парсинг тяжелый и сайт как-то задерживает столько реквестов в секунду(если такое понятие существует)

Assa Byn
попробовал, результат почти тот же, те же 90-100 с...

во-первых нужно понять во что ты упираешься и как именно "пробовал".

Assa-Byn Автор вопроса
Alex
во-первых нужно понять во что ты упираешься и как ...

Сверху скидывал скрины кода, многопроцессовую задачу создавал точно также

Assa Byn
6

6 физических? Ты не путаешь с логическими? Скажи процессор, пожалуйста.

Assa Byn
думаю путаю, intel 9400

Если i5 9400, то, кажется, не путаешь. Тогда должно было распараллелиться аккуратно, значит странности есть. Видимо, код всё же багованный.

Assa-Byn Автор вопроса
Oskar Sharipov
Если i5 9400, то, кажется, не путаешь. Тогда должн...

Да, думаю так и есть. Попробовал в три потока, скорость та же самая что и при 5 потоках. Спасибо большое

Assa Byn
Да, думаю так и есть. Попробовал в три потока, ско...

дай угадаю, ты делаешь запросы и сразу же парсишь ответ в том же потоке \ процессе?

Assa Byn
да

ну а чего ты ожидал? пока твой процесс лазит в сеть, он просто ждет.

Assa-Byn Автор вопроса
Alex
ну а чего ты ожидал? пока твой процесс лазит в сет...

не, я выше писал что при парсинге 40 страниц уходит 30-40 секунд, а при парсинге 200 страниц(в 5 потоков, на каждый поток дал по 40 страниц) парсит 100 секунд. Поэтому спросил, правильно ли я структуировал многопоточный код

Assa Byn
не, я выше писал что при парсинге 40 страниц уходи...

нет, не правильно. узкое место у тебя очевидно не CPU.

Well Done
.

нет. и вообще замерять нужно, а не гадать.

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
Коллеги, доброе утро. Запустил на удаленном хосте приложение (ручками зашел туда по ssh и запустил, не командой удаленно). Создал потом ssh-туннель, и с моей машины приложение...
Δημήτηρ
9
Карта сайта