170 похожих чатов

В AVX512 есть команды, которые могут параллельно просуммировать все 32

регистра? Или только по 1 регистру за раз? И это как нибудь можно дополнительно распараллелить/ускорить?

21 ответов

9 просмотров

Проц сам распараллелит операции над независимыми регистрами, если у него хватит портов исполнения

для этого есть гпу (хотя я бы даже на гпу так делать не стал)

с таким уровнем знаний вам IMHO не стоит лезть в AVX-512

Если память не изменяет то 512 бита. Что ты туда загрузишь - это твоей дело. т.е. тебе сначала нужно туда запихать данные, сделать операции, выгрузить, обратить внимание на выравнивание (это может быть важно).

usernameak
для этого есть гпу (хотя я бы даже на гпу так дела...

GPU это сильно другое. Это массовый параллелизм, т.е. выполнение одного кода (желательно без условий) на 1000 ядер (или сколько там у тебя их будет) параллельно.

Viktor Chyzhdzenka
GPU это сильно другое. Это массовый параллелизм, т...

ну обычно такие задачи для массового параллелизма и есть :)

usernameak
ну обычно такие задачи для массового параллелизма ...

Где у него массовый? AVX, SSE и т.п. - это маленькая векторизация на вектора в 2-4-8-(небольшое количество) элементов. Т.е. теоретически то, что у тебя считалось T времени в иделальном варианте ты можешь ускорить в 2-4-8- раз.

Viktor Chyzhdzenka
Где у него массовый? AVX, SSE и т.п. - это маленьк...

ну а у него далеко не небольшое количество предполагается походу :) но тут сама задача вызывает вопросы

usernameak
ну а у него далеко не небольшое количество предпол...

Тогда напомню, что гпу не всегда в наличии, а еще не забыть, что загрузка в гпу и выгрузка медленные. Для сравнения в большинстве счетных задач 1080 и 6 ядерный проц сравнимы. Различия значимые только на очень специфических задачах.

Viktor Chyzhdzenka
Тогда напомню, что гпу не всегда в наличии, а еще ...

Это как это ? Как может быть, что ГПУ не всегда в наличии ?

Viktor Chyzhdzenka
Запросто. Не у всех всякие 3090.

У Вас наблюдаются отклонения в логическом мышлении

Еще раз повторю вопрос: Как может быть, что ГПУ не всегда в наличии ? Прочитайте Внимательно.

Andrey Electron
Еще раз повторю вопрос: Как может быть, что ГПУ не...

Запросто. Море компьютеров без гпу. В телефонах оное лучше не юзать - разрядишь за 30 мин.

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
63
Хотел бы спросить у знающих, правильную ли я выбрал книгу для начала изучения ассемблера Юрова В.И ? Или есть более лучшие книги для начала обучения?
Botsman
25
Книга Юрова В.И пойдёт для обучения?
Botsman
24
Люди добрые, помогите с идеями, потому что свои закончились. У клиента падает софтина в момент инициализации модуля OtlEventMonitor на RegisterWindowMessage('Gp/OtlTaskEvents/...
Михаил Усков
7
$params = [ 'formid' => 'feedbackForm', 'formTpl' => '@CODE: <form class="form-validate" data-id="ajax_form"> <fieldset class="margin-bottom-md"> ...
Pathologic
1
> Примечательно, что новый владелец удаляет из GitHub любые жалобы, указывающие на подозрительную активность или смену владельца, и, видимо, рассчитывает на то, что пользовате...
Alex Sherbakov
2
GridView fully ignored first parent(SizedBox), and take width from second parent(Container). How can I constrain GridView by first parent? Widget build(BuildContext context) {...
Hamster
1
Hey there Which is the best Linux destro for developers (coding)? To my research on reddit, they said Linux mint is good for mid level spec and Ubuntu for high Lev hardwar...
Wiz 🪄
11
И ещё вопрос: можно ли типа как на дос как-то запариться и с помощью прерываний выводить текст, вместо функции printf ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
34
а мы ещё не созрели до того, чтобы создать отдельный чатик про настройку редакторов?
Cheese Syrowiecki
16
Карта сайта