169 похожих чатов

Когда у Эльбруса будет 256-битный SIMD?

38 ответов

67 просмотров

когда будут те, кто в него умеет - а пока .. мало кому 128ми битные то нужны

Смотрите, у интел 2x512(1024), у e2k 6x128(768), разница не такая драматичная, у амд, кстати, пока даже меньше. Добавление 256 сильно утяжелит ядро по площади и мощности, а плюсы в эффективном использовании призрачные

Mikhail Slesarev
Смотрите, у интел 2x512(1024), у e2k 6x128(768), р...

Если нет более новых ядер, чем Alder Lake-P, то FMA там вообще одна 512-битная, остальное в своём большинстве по 2 устройства. Так что всё ещё достоин. Единственное, в чём Эльбрус немного отстаёт от желаемого уровня, — это целочисленные операции, но я слышал хорошие новости про v7.

Mikhail Slesarev
Смотрите, у интел 2x512(1024), у e2k 6x128(768), р...

256 все ещё довольно активно можно использовать, а вот выше уже только специфика остается. Не зря АМД на AVX2 остановилась.

Так себе аргумент , наоборот же интересно что другая архитектура

слушай, давай не переигрывай уже )

ge0gr4f
слушай, давай не переигрывай уже )

Я просто иногда не понимаю он рофлит или нет )

Mydream (Python ONE LOVE)
Так себе аргумент , наоборот же интересно что друг...

Я даже вопроса не понял. "в 90" это что? В 90 раз? Это в каких задачах? У меня получилось только в 40 раз медленнее. Нужно больше контекста.

Mydream (Python ONE LOVE)
Так себе аргумент , наоборот же интересно что друг...

DEC Alpha тоже другая архитектура. Только почему-то мертвая.

SNEJANA ONE LOVE
DEC Alpha тоже другая архитектура. Только почему-т...

Ну явно не из-за проблем архитектурного уровня.

SNEJANA ONE LOVE
Я даже вопроса не понял. "в 90" это что? В 90 раз?...

Твоё сообщение не могу найти сегодня видел где ты писал , мб удалил либо там цифра не 90 была

SNEJANA ONE LOVE
https://t.me/c/1303061060/60983 В 40 раз же.

Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне 4770к , 16с -9900к , не ?)

SNEJANA ONE LOVE
https://t.me/c/1303061060/60983 В 40 раз же.

При том что я не уверен что все изучено и если софт подгонять как апл то вообще все гуд будет , но нужны бабки и политика как у них )

Mydream (Python ONE LOVE)
Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне ...

Потому что код говно, и никто два ляма строк кода в нормальном состоянии переписывать под эльбрусы не будет. Так что только пилить компилятор, чтобы жрал говнокод и делал работу за людей. На i7-870 примерно те же самые цифры будут. Так что там не особо важно, что 8с на уровне 4770к.

Andrey-Petroff Автор вопроса

Однако площадь и мощность ядер у "интелов не "утяжеляет". Ваш пост похож на отговорку. просто скажите прямо, что мы не можем сделать 256-битный SIMD потому что уровень TDP Эльбруса вообще улетит в небеса. И не нужно писать глупости про бессмысленность этого, вы прекрасно понимаете, что из 6 каналов Эльбруса только 4 снабжены полноценными 128-битными SIMD.

>Однако площадь и мощность ядер у "интелов не "утяжеляет" Сравните размер P и E в новых интелах - в первых есть AVX512, а во вторых нет

Andrey-Petroff Автор вопроса
kobyakov aa
>Однако площадь и мощность ядер у "интелов не "ут...

Это не имеет значения. В моем ноутбуке у копеечного i3-7100U есть поддержка 256-битных операций - AVX2.

Andrey Petroff
Однако площадь и мощность ядер у "интелов не "утя...

Посмотрите размер блока avx512 (про не утяжеляет у интел)

Andrey Petroff
Однако площадь и мощность ядер у "интелов не "утя...

Интересно, давайте поинтересуемся у сообщества, что лучше, к примеру 32 ядра с simd128 или 24 с simd256. Максим Маслов так вообще против flops’ой производительности.

Andrey-Petroff Автор вопроса
Mikhail Slesarev
Посмотрите размер блока avx512 (про не утяжеляет у...

речь не идет об AVX512. Речь идет о том, почему у Эльбрусов нет 256-битных SIMD блоков. что может быть полезным для нативного кода и динамической трансляции. Все остальное отговорки.

Andrey Petroff
речь не идет об AVX512. Речь идет о том, почему у ...

Может помочь, а может не помочь. Вы же не приводите цифр. Отговорки, так отговорки

Andrey-Petroff Автор вопроса
Mikhail Slesarev
Может помочь, а может не помочь. Вы же не приводит...

Это МЦСТ не приводит цифр. Где официальные результаты тетсов SPEC 2017? Их нет и не будет! Были неофициальные результаты в статье на Хабре и з которых понятно, что Эльбрус не способен конкурировать с современными микропроцессорами.

Здрасьте
32/128

А что, у нас много софта умеет в идеальную параллелизацию?

SNEJANA ONE LOVE
А что, у нас много софта умеет в идеальную паралле...

Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты предлагаешь не учится и не улучшать ПО. Для меня это дико. Если имеются в виду непараллелящиеся алгоритмы, которые работают с большими числами, то на данные момент слишком специфичная ниша, чтобы "тянуть её в ядро".

Здрасьте
Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты пр...

Не. Не предлагаю не учиться и не улучшать ПО. Просто некоторые вещи не затыкаются кучей медленных ядер и им нужно немного, но быстрых. У меня есть пара дурацких алгоритмов, которые можно параллелить симдом (и то примерно до 16-20 даблов за раз, дальше уже не эффективно), но нельзя потоками, так как синхронизация данных займет очень много времени.

SNEJANA ONE LOVE
Не. Не предлагаю не учиться и не улучшать ПО. Прос...

А, нужны не большие числа, а обработка упакованных. Но ведь такое нужно не всем. Процессор всё-таки универсальный.

Здрасьте
А, нужны не большие числа, а обработка упакованных...

Тогда нафига ему 32 ядра, когда от универсального чаще всего ждут скорости в однопотоке?

SNEJANA ONE LOVE
Не. Не предлагаю не учиться и не улучшать ПО. Прос...

У меня есть алгоритмы, где и SIMD не поможет: нужно просто много обычных ядер. Параллелизм уровня данных, но не более того; сам влгоритм сильно ветвящийся.

SNEJANA ONE LOVE
А. И тоже согласен с этим :-)

В ВУЗе, где я раньше работал (МИФИ) сейчас есть разные кластеры под разные задачи: TPU, GPGPU, простые CPU. Недавно они исследовали что выгоднее по FLOPS/$ для не-SIMD задач. Оказалось, что ARM будет выгоднее Intel.

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
1
Он в одиночку это дело запилил или была какая-то команда?
Aquinary
12
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Карта сайта