Подскажите, пожалуйста Пытаюсь с помощью openmp распараллелить следующее Имеется вектор объектов

Question

Подскажите, пожалуйста Пытаюсь с помощью openmp распараллелить следующее Имеется вектор объектов

моего типа
Каждый из этих объектов хранит в себе указатели на остальные (думаю важное замечание, нужно для вычислений, см далее)

В цикле для каждого из этих объектов вызываю некоторый метод, который использует в вычислениях те самые указатели на другие объекты

Этот цикл хочу распараллелить
Пробывал разные варианты директив

Судя по описанию понял, что мне должно подходить:

#pragma omp parallel for shared(мой вектор) private(i - индекс, используемый в цикле)

Но и при этом и при других сочетаниях ничего не изменяется
Без директив и с ними время не изменяется

Число объектов 2к
Функция, которая вызывается для каждого объекта перебирает все остальные, дергает некоторые их поля и что-то считает

По заданию и логике ускорение быть должно, но ничего не изменяется

Подскажите, в каком направлении копать?

#c #embedded #programming #russian

0

01.04.2022

26 ответов

42 просмотра

Игорь Ильич Автор вопроса

Ilya Zviagin
Копать в направлении отсылки актуального кода.

Фото нельзя наверное? Нет возможности скопировать пока что

0

01.04.2022

Ilya Zviagin

Игорь Ильич
Фото нельзя наверное? Нет возможности скопировать ...

По фото мы не лечим. Это - к Кашпировскому.

0

01.04.2022

Игорь Ильич Автор вопроса

Ilya Zviagin
По фото мы не лечим. Это - к Кашпировскому.

Скину позже тогда :)

0

01.04.2022

Il V

Добавьте явно num_threads(требуемоеколичество потоков) Прям в прагму в конец, если не принципиально чтобы i была объявлена до цикла, то private можно не указывать, а объявить переменную прям в цикле, она автоматически будет private

0

01.04.2022

Игорь Ильич Автор вопроса

Il V
Добавьте явно num_threads(требуемоеколичество пото...

Я до этого использовал omp_set_num_threads Или это не влияет?

0

01.04.2022

Ilya Zviagin

А можно встречный вопрос, зачем именно OMP использовать надо ?

0

01.04.2022

Il V

Игорь Ильич
Я до этого использовал omp_set_num_threads Или это...

Ну поидее должно было сработать

0

01.04.2022

Игорь Ильич Автор вопроса

Ilya Zviagin
А можно встречный вопрос, зачем именно OMP использ...

Задание

0

01.04.2022

Alexandr Rudalev

Достаточно: #pragma omp parallel for for(size_t i=0; i<N; ++i) { ... } shared - по умолчанию ко всем, кроме индекса цикла, который private. прагма должна обязательно быть перед циклом. > Число объектов 2к А время работы какое? Если очень маленькое, то надо увеличить число объектов. Иначе время на создание потоков и их запуск будет больше работы.

0

01.04.2022

Ilya Zviagin

Alexandr Rudalev
Достаточно: #pragma omp parallel for for(size_t i...

При этом важно, ЧТО внутри цикла...

0

01.04.2022

Alexandr Rudalev

Ну и стоит проверить что openmp вообще работает, а то классическая ошибка - не до настроили студию.

0

01.04.2022

Игорь Ильич Автор вопроса

Alexandr Rudalev
Ну и стоит проверить что openmp вообще работает, а...

Те может всё компилироваться, но не работать?

0

01.04.2022

Alexandr Rudalev

Игорь Ильич
Те может всё компилироваться, но не работать?

Может скомпилироваться с выключенной поддержкой openmp и работать на однонм потоке

0

01.04.2022

Игорь Ильич Автор вопроса

Alexandr Rudalev
Достаточно: #pragma omp parallel for for(size_t i...

20 секунд К общей памяти обращений много Очень По сути только это и происходит

0

01.04.2022

Игорь Ильич Автор вопроса

Alexandr Rudalev
Может скомпилироваться с выключенной поддержкой op...

Ясно Как лучше проверить На элементарном цикле вывести номера потоков?

0

01.04.2022

Alexandr Rudalev

Игорь Ильич
Ясно Как лучше проверить На элементарном цикле вы...

#pragma omp parallel { printf("%d\n", omp_get_thread_num()); } как-то так достаточно

0

01.04.2022

Alexandr Rudalev

Игорь Ильич
20 секунд К общей памяти обращений много Очень П...

20 секунд это много, ещё стоит посмотреть на неявное использование блокирующего ресурса.

0

01.04.2022

Игорь Ильич Автор вопроса

Alexandr Rudalev
20 секунд это много, ещё стоит посмотреть на неявн...

Звучит понятно Непонятно как посмотреть Или нужно просто знать?

0

01.04.2022

Alexandr Rudalev

Игорь Ильич
Звучит понятно Непонятно как посмотреть Или нужно...

Ну тут надо смотреть какие функции используются, классика: #pragma omp parallel for for(size_t i=0; i<N; ++i) { x[i] = rand() % 100; } В windows может летать, а в Linux стать работать в десятки раз дольше, т.к. rand() использует глобальный объект с блокировкой.

0

01.04.2022

Игорь Ильич Автор вопроса

Ilya Zviagin
По фото мы не лечим. Это - к Кашпировскому.

https://pastebin.com/D9iK2Q6j

0

01.04.2022

Ilya Zviagin

Игорь Ильич
https://pastebin.com/D9iK2Q6j

Это вопрос про OpenMP. Я нашёл только два for с прагмами, в обоих - вызовы функций в теле. Я не знаю omp досконально, но на мой взгляд это может не распараллеливаться вообще. Мне кажется, нужен прямой код

0

02.04.2022

Ilya Zviagin

Игорь Ильич
https://pastebin.com/D9iK2Q6j

Лучше указать, какой for у тебя проблемный

0

02.04.2022

Il V

Игорь Ильич
https://pastebin.com/D9iK2Q6j

А как собирается?

0

02.04.2022