169 похожих чатов

Когда у Эльбруса будет 256-битный SIMD?

38 ответов

31 просмотр

когда будут те, кто в него умеет - а пока .. мало кому 128ми битные то нужны

Смотрите, у интел 2x512(1024), у e2k 6x128(768), разница не такая драматичная, у амд, кстати, пока даже меньше. Добавление 256 сильно утяжелит ядро по площади и мощности, а плюсы в эффективном использовании призрачные

Mikhail Slesarev
Смотрите, у интел 2x512(1024), у e2k 6x128(768), р...

Если нет более новых ядер, чем Alder Lake-P, то FMA там вообще одна 512-битная, остальное в своём большинстве по 2 устройства. Так что всё ещё достоин. Единственное, в чём Эльбрус немного отстаёт от желаемого уровня, — это целочисленные операции, но я слышал хорошие новости про v7.

Mikhail Slesarev
Смотрите, у интел 2x512(1024), у e2k 6x128(768), р...

256 все ещё довольно активно можно использовать, а вот выше уже только специфика остается. Не зря АМД на AVX2 остановилась.

Так себе аргумент , наоборот же интересно что другая архитектура

слушай, давай не переигрывай уже )

ge0gr4f
слушай, давай не переигрывай уже )

Я просто иногда не понимаю он рофлит или нет )

Mydream (Python ONE LOVE)
Так себе аргумент , наоборот же интересно что друг...

Я даже вопроса не понял. "в 90" это что? В 90 раз? Это в каких задачах? У меня получилось только в 40 раз медленнее. Нужно больше контекста.

Mydream (Python ONE LOVE)
Так себе аргумент , наоборот же интересно что друг...

DEC Alpha тоже другая архитектура. Только почему-то мертвая.

SNEJANA ONE LOVE
DEC Alpha тоже другая архитектура. Только почему-т...

Ну явно не из-за проблем архитектурного уровня.

SNEJANA ONE LOVE
Я даже вопроса не понял. "в 90" это что? В 90 раз?...

Твоё сообщение не могу найти сегодня видел где ты писал , мб удалил либо там цифра не 90 была

SNEJANA ONE LOVE
https://t.me/c/1303061060/60983 В 40 раз же.

Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне 4770к , 16с -9900к , не ?)

SNEJANA ONE LOVE
https://t.me/c/1303061060/60983 В 40 раз же.

При том что я не уверен что все изучено и если софт подгонять как апл то вообще все гуд будет , но нужны бабки и политика как у них )

Mydream (Python ONE LOVE)
Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне ...

Потому что код говно, и никто два ляма строк кода в нормальном состоянии переписывать под эльбрусы не будет. Так что только пилить компилятор, чтобы жрал говнокод и делал работу за людей. На i7-870 примерно те же самые цифры будут. Так что там не особо важно, что 8с на уровне 4770к.

Andrey-Petroff Автор вопроса

Однако площадь и мощность ядер у "интелов не "утяжеляет". Ваш пост похож на отговорку. просто скажите прямо, что мы не можем сделать 256-битный SIMD потому что уровень TDP Эльбруса вообще улетит в небеса. И не нужно писать глупости про бессмысленность этого, вы прекрасно понимаете, что из 6 каналов Эльбруса только 4 снабжены полноценными 128-битными SIMD.

>Однако площадь и мощность ядер у "интелов не "утяжеляет" Сравните размер P и E в новых интелах - в первых есть AVX512, а во вторых нет

Andrey-Petroff Автор вопроса
kobyakov aa
>Однако площадь и мощность ядер у "интелов не "ут...

Это не имеет значения. В моем ноутбуке у копеечного i3-7100U есть поддержка 256-битных операций - AVX2.

Andrey Petroff
Однако площадь и мощность ядер у "интелов не "утя...

Посмотрите размер блока avx512 (про не утяжеляет у интел)

Andrey Petroff
Однако площадь и мощность ядер у "интелов не "утя...

Интересно, давайте поинтересуемся у сообщества, что лучше, к примеру 32 ядра с simd128 или 24 с simd256. Максим Маслов так вообще против flops’ой производительности.

Andrey-Petroff Автор вопроса
Mikhail Slesarev
Посмотрите размер блока avx512 (про не утяжеляет у...

речь не идет об AVX512. Речь идет о том, почему у Эльбрусов нет 256-битных SIMD блоков. что может быть полезным для нативного кода и динамической трансляции. Все остальное отговорки.

Andrey Petroff
речь не идет об AVX512. Речь идет о том, почему у ...

Может помочь, а может не помочь. Вы же не приводите цифр. Отговорки, так отговорки

Andrey-Petroff Автор вопроса
Mikhail Slesarev
Может помочь, а может не помочь. Вы же не приводит...

Это МЦСТ не приводит цифр. Где официальные результаты тетсов SPEC 2017? Их нет и не будет! Были неофициальные результаты в статье на Хабре и з которых понятно, что Эльбрус не способен конкурировать с современными микропроцессорами.

Здрасьте
32/128

А что, у нас много софта умеет в идеальную параллелизацию?

SNEJANA ONE LOVE
А что, у нас много софта умеет в идеальную паралле...

Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты предлагаешь не учится и не улучшать ПО. Для меня это дико. Если имеются в виду непараллелящиеся алгоритмы, которые работают с большими числами, то на данные момент слишком специфичная ниша, чтобы "тянуть её в ядро".

Здрасьте
Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты пр...

Не. Не предлагаю не учиться и не улучшать ПО. Просто некоторые вещи не затыкаются кучей медленных ядер и им нужно немного, но быстрых. У меня есть пара дурацких алгоритмов, которые можно параллелить симдом (и то примерно до 16-20 даблов за раз, дальше уже не эффективно), но нельзя потоками, так как синхронизация данных займет очень много времени.

SNEJANA ONE LOVE
Не. Не предлагаю не учиться и не улучшать ПО. Прос...

А, нужны не большие числа, а обработка упакованных. Но ведь такое нужно не всем. Процессор всё-таки универсальный.

Здрасьте
А, нужны не большие числа, а обработка упакованных...

Тогда нафига ему 32 ядра, когда от универсального чаще всего ждут скорости в однопотоке?

SNEJANA ONE LOVE
Не. Не предлагаю не учиться и не улучшать ПО. Прос...

У меня есть алгоритмы, где и SIMD не поможет: нужно просто много обычных ядер. Параллелизм уровня данных, но не более того; сам влгоритм сильно ветвящийся.

SNEJANA ONE LOVE
А. И тоже согласен с этим :-)

В ВУЗе, где я раньше работал (МИФИ) сейчас есть разные кластеры под разные задачи: TPU, GPGPU, простые CPU. Недавно они исследовали что выгоднее по FLOPS/$ для не-SIMD задач. Оказалось, что ARM будет выгоднее Intel.

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Кто-нибудь знает почему SPM клонирует репо целиком? Некоторые репы просто огромные, как та же swift-syntax которая нужна для использования макросов. Сначала подумал, что это...
iMike
6
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
11
;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, стандартный ;вызов процедуры ;option casemap:no...
Егор Анелькин
1
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
Карта сайта