Когда у Эльбруса будет 256-битный SIMD?

Mikhail Slesarev
Смотрите, у интел 2x512(1024), у e2k 6x128(768), р...

Смотрите, у интел 2x512(1024), у e2k 6x128(768), разница не такая драматичная, у амд, кстати, пока даже меньше. Добавление 256 сильно утяжелит ядро по площади и мощности, а плюсы в эффективном использовании призрачные

0

22.02.2022

Dmitry Shcherbakov

Если нет более новых ядер, чем Alder Lake-P, то FMA там вообще одна 512-битная, остальное в своём большинстве по 2 устройства. Так что всё ещё достоин. Единственное, в чём Эльбрус немного отстаёт от желаемого уровня, — это целочисленные операции, но я слышал хорошие новости про v7.

0

22.02.2022

Mikhail Slesarev
Смотрите, у интел 2x512(1024), у e2k 6x128(768), р...

256 все ещё довольно активно можно использовать, а вот выше уже только специфика остается. Не зря АМД на AVX2 остановилась.

0

22.02.2022

SNEJANA ONE LOVE
256 все ещё довольно активно можно использовать, а...

Почему Эльбрус в 90 медленней ?

0

22.02.2022

Mydream (Python ONE LOVE)
Почему Эльбрус в 90 медленней ?

Потому что не нужен

0

22.02.2022

Так себе аргумент , наоборот же интересно что другая архитектура

0

22.02.2022

ge0gr4f

слушай, давай не переигрывай уже )

0

22.02.2022

ge0gr4f
слушай, давай не переигрывай уже )

Я просто иногда не понимаю он рофлит или нет )

0

22.02.2022

Mydream (Python ONE LOVE)
Так себе аргумент , наоборот же интересно что друг...

Я даже вопроса не понял. "в 90" это что? В 90 раз? Это в каких задачах? У меня получилось только в 40 раз медленнее. Нужно больше контекста.

0

22.02.2022

Mydream (Python ONE LOVE)
Так себе аргумент , наоборот же интересно что друг...

DEC Alpha тоже другая архитектура. Только почему-то мертвая.

0

22.02.2022

Evgeny Vasin

SNEJANA ONE LOVE
DEC Alpha тоже другая архитектура. Только почему-т...

Ну явно не из-за проблем архитектурного уровня.

0

22.02.2022

Аϱτεμις (C# ONE LOVE)

Mydream (Python ONE LOVE)
Я просто иногда не понимаю он рофлит или нет )

Много за компом сидит, пчихика перегружена.

0

22.02.2022

SNEJANA ONE LOVE
Я даже вопроса не понял. "в 90" это что? В 90 раз?...

Твоё сообщение не могу найти сегодня видел где ты писал , мб удалил либо там цифра не 90 была

0

22.02.2022

Mydream (Python ONE LOVE)
Твоё сообщение не могу найти сегодня видел где ты ...

https://t.me/c/1303061060/60983 В 40 раз же.

0

22.02.2022

SNEJANA ONE LOVE
https://t.me/c/1303061060/60983 В 40 раз же.

Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне 4770к , 16с -9900к , не ?)

0

22.02.2022

SNEJANA ONE LOVE
https://t.me/c/1303061060/60983 В 40 раз же.

При том что я не уверен что все изучено и если софт подгонять как апл то вообще все гуд будет , но нужны бабки и политика как у них )

0

22.02.2022

Dmitriy [Отпуск]

Mydream (Python ONE LOVE)
Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне ...

Ничоси заявление

0

22.02.2022

Mydream (Python ONE LOVE)
Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне ...

Потому что код говно, и никто два ляма строк кода в нормальном состоянии переписывать под эльбрусы не будет. Так что только пилить компилятор, чтобы жрал говнокод и делал работу за людей. На i7-870 примерно те же самые цифры будут. Так что там не особо важно, что 8с на уровне 4770к.

0

22.02.2022

Andrey Petroff Автор вопроса

Однако площадь и мощность ядер у "интелов не "утяжеляет". Ваш пост похож на отговорку. просто скажите прямо, что мы не можем сделать 256-битный SIMD потому что уровень TDP Эльбруса вообще улетит в небеса. И не нужно писать глупости про бессмысленность этого, вы прекрасно понимаете, что из 6 каналов Эльбруса только 4 снабжены полноценными 128-битными SIMD.

0

24.02.2022

kobyakov aa

>Однако площадь и мощность ядер у "интелов не "утяжеляет" Сравните размер P и E в новых интелах - в первых есть AVX512, а во вторых нет

0

24.02.2022

Andrey Petroff Автор вопроса

kobyakov aa
>Однако площадь и мощность ядер у "интелов не "ут...

Это не имеет значения. В моем ноутбуке у копеечного i3-7100U есть поддержка 256-битных операций - AVX2.

0

24.02.2022

Andrey Petroff
Однако площадь и мощность ядер у "интелов не "утя...

Посмотрите размер блока avx512 (про не утяжеляет у интел)

0

24.02.2022

Andrey Petroff
Однако площадь и мощность ядер у "интелов не "утя...

Интересно, давайте поинтересуемся у сообщества, что лучше, к примеру 32 ядра с simd128 или 24 с simd256. Максим Маслов так вообще против flops’ой производительности.

0

24.02.2022

Mikhail Slesarev
Интересно, давайте поинтересуемся у сообщества, чт...

24 simd256

0

24.02.2022

Andrey Petroff Автор вопроса

Mikhail Slesarev
Посмотрите размер блока avx512 (про не утяжеляет у...

речь не идет об AVX512. Речь идет о том, почему у Эльбрусов нет 256-битных SIMD блоков. что может быть полезным для нативного кода и динамической трансляции. Все остальное отговорки.

0

24.02.2022

Andrey Petroff
речь не идет об AVX512. Речь идет о том, почему у ...

Может помочь, а может не помочь. Вы же не приводите цифр. Отговорки, так отговорки

0

24.02.2022

Andrey Petroff Автор вопроса

Mikhail Slesarev
Может помочь, а может не помочь. Вы же не приводит...

Это МЦСТ не приводит цифр. Где официальные результаты тетсов SPEC 2017? Их нет и не будет! Были неофициальные результаты в статье на Хабре и з которых понятно, что Эльбрус не способен конкурировать с современными микропроцессорами.

0

24.02.2022

Mikhail Slesarev
Интересно, давайте поинтересуемся у сообщества, чт...

32/128

0

24.02.2022

Здрасьте
32/128

А что, у нас много софта умеет в идеальную параллелизацию?

0

24.02.2022

SNEJANA ONE LOVE
А что, у нас много софта умеет в идеальную паралле...

Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты предлагаешь не учится и не улучшать ПО. Для меня это дико. Если имеются в виду непараллелящиеся алгоритмы, которые работают с большими числами, то на данные момент слишком специфичная ниша, чтобы "тянуть её в ядро".

0

24.02.2022

Здрасьте
Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты пр...

Не. Не предлагаю не учиться и не улучшать ПО. Просто некоторые вещи не затыкаются кучей медленных ядер и им нужно немного, но быстрых. У меня есть пара дурацких алгоритмов, которые можно параллелить симдом (и то примерно до 16-20 даблов за раз, дальше уже не эффективно), но нельзя потоками, так как синхронизация данных займет очень много времени.

0

24.02.2022

SNEJANA ONE LOVE
Не. Не предлагаю не учиться и не улучшать ПО. Прос...

А, нужны не большие числа, а обработка упакованных. Но ведь такое нужно не всем. Процессор всё-таки универсальный.

0

24.02.2022

Здрасьте
А, нужны не большие числа, а обработка упакованных...

Тогда нафига ему 32 ядра, когда от универсального чаще всего ждут скорости в однопотоке?

0

24.02.2022

bircoph

SNEJANA ONE LOVE
Не. Не предлагаю не учиться и не улучшать ПО. Прос...

У меня есть алгоритмы, где и SIMD не поможет: нужно просто много обычных ядер. Параллелизм уровня данных, но не более того; сам влгоритм сильно ветвящийся.

0

24.02.2022

bircoph
У меня есть алгоритмы, где и SIMD не поможет: нужн...

А. И тоже согласен с этим :-)

0

24.02.2022