когда будут те, кто в него умеет - а пока .. мало кому 128ми битные то нужны
Смотрите, у интел 2x512(1024), у e2k 6x128(768), разница не такая драматичная, у амд, кстати, пока даже меньше. Добавление 256 сильно утяжелит ядро по площади и мощности, а плюсы в эффективном использовании призрачные
Если нет более новых ядер, чем Alder Lake-P, то FMA там вообще одна 512-битная, остальное в своём большинстве по 2 устройства. Так что всё ещё достоин. Единственное, в чём Эльбрус немного отстаёт от желаемого уровня, — это целочисленные операции, но я слышал хорошие новости про v7.
256 все ещё довольно активно можно использовать, а вот выше уже только специфика остается. Не зря АМД на AVX2 остановилась.
Почему Эльбрус в 90 медленней ?
Потому что не нужен
Так себе аргумент , наоборот же интересно что другая архитектура
слушай, давай не переигрывай уже )
Я просто иногда не понимаю он рофлит или нет )
Я даже вопроса не понял. "в 90" это что? В 90 раз? Это в каких задачах? У меня получилось только в 40 раз медленнее. Нужно больше контекста.
DEC Alpha тоже другая архитектура. Только почему-то мертвая.
Ну явно не из-за проблем архитектурного уровня.
Много за компом сидит, пчихика перегружена.
Твоё сообщение не могу найти сегодня видел где ты писал , мб удалил либо там цифра не 90 была
https://t.me/c/1303061060/60983 В 40 раз же.
Ой сорри , 40 ) почему не в 2 ?) 8св же на уровне 4770к , 16с -9900к , не ?)
При том что я не уверен что все изучено и если софт подгонять как апл то вообще все гуд будет , но нужны бабки и политика как у них )
Потому что код говно, и никто два ляма строк кода в нормальном состоянии переписывать под эльбрусы не будет. Так что только пилить компилятор, чтобы жрал говнокод и делал работу за людей. На i7-870 примерно те же самые цифры будут. Так что там не особо важно, что 8с на уровне 4770к.
Однако площадь и мощность ядер у "интелов не "утяжеляет". Ваш пост похож на отговорку. просто скажите прямо, что мы не можем сделать 256-битный SIMD потому что уровень TDP Эльбруса вообще улетит в небеса. И не нужно писать глупости про бессмысленность этого, вы прекрасно понимаете, что из 6 каналов Эльбруса только 4 снабжены полноценными 128-битными SIMD.
>Однако площадь и мощность ядер у "интелов не "утяжеляет" Сравните размер P и E в новых интелах - в первых есть AVX512, а во вторых нет
Это не имеет значения. В моем ноутбуке у копеечного i3-7100U есть поддержка 256-битных операций - AVX2.
Посмотрите размер блока avx512 (про не утяжеляет у интел)
Интересно, давайте поинтересуемся у сообщества, что лучше, к примеру 32 ядра с simd128 или 24 с simd256. Максим Маслов так вообще против flops’ой производительности.
речь не идет об AVX512. Речь идет о том, почему у Эльбрусов нет 256-битных SIMD блоков. что может быть полезным для нативного кода и динамической трансляции. Все остальное отговорки.
Может помочь, а может не помочь. Вы же не приводите цифр. Отговорки, так отговорки
Это МЦСТ не приводит цифр. Где официальные результаты тетсов SPEC 2017? Их нет и не будет! Были неофициальные результаты в статье на Хабре и з которых понятно, что Эльбрус не способен конкурировать с современными микропроцессорами.
А что, у нас много софта умеет в идеальную параллелизацию?
Эм-м-м. Знаешь, я даже затрудняюсь ответить. Ты предлагаешь не учится и не улучшать ПО. Для меня это дико. Если имеются в виду непараллелящиеся алгоритмы, которые работают с большими числами, то на данные момент слишком специфичная ниша, чтобы "тянуть её в ядро".
Не. Не предлагаю не учиться и не улучшать ПО. Просто некоторые вещи не затыкаются кучей медленных ядер и им нужно немного, но быстрых. У меня есть пара дурацких алгоритмов, которые можно параллелить симдом (и то примерно до 16-20 даблов за раз, дальше уже не эффективно), но нельзя потоками, так как синхронизация данных займет очень много времени.
А, нужны не большие числа, а обработка упакованных. Но ведь такое нужно не всем. Процессор всё-таки универсальный.
Тогда нафига ему 32 ядра, когда от универсального чаще всего ждут скорости в однопотоке?
У меня есть алгоритмы, где и SIMD не поможет: нужно просто много обычных ядер. Параллелизм уровня данных, но не более того; сам влгоритм сильно ветвящийся.
А. И тоже согласен с этим :-)
Мне, например, чаще нужно больше ядер.
В ВУЗе, где я раньше работал (МИФИ) сейчас есть разные кластеры под разные задачи: TPU, GPGPU, простые CPU. Недавно они исследовали что выгоднее по FLOPS/$ для не-SIMD задач. Оказалось, что ARM будет выгоднее Intel.
Обсуждают сегодня