Добрый вечер, уважаемые знатоки. Не знаете ли вы как сравнивать

xmm регистры, в которых лежат unsigned значения? Нужно узнать в каком большее значение. К сожалению, подсчет Leading Zero Bits невозможен, а все встроенные инструкции сравнивают только signed значения

#assembler #programming #russian

31.05.2023

19 ответов

24 просмотра

КТ315

VPTEST?

31.05.2023

Dog_with_a_Tail Автор вопроса

КТ315
VPTEST?

Оно, насколько я понял, bitwise and сделает, но не покажет какой из операндов больше

31.05.2023

disba1ancer

Dog_with_a_Tail
Оно, насколько я понял, bitwise and сделает, но не...

Тебе нужно сравнить ответ с любым слагаемым, если ответ меньше, значит имело место переполнение, но по любому должны быть какие-то флаги

31.05.2023

Dog_with_a_Tail Автор вопроса

disba1ancer
Тебе нужно сравнить ответ с любым слагаемым, если ...

Сравнить то нужно, но вот нигде никакие флаги не задаются, просто "When an individual result is too large to be represented in 8 bits (overflow), the result is wrapped around and the low 8 bits are written to the destination operand (that is, the carry is ignored)."

31.05.2023

КТ315

Dog_with_a_Tail
Сравнить то нужно, но вот нигде никакие флаги не з...

Так тебе всего-то нужны флаги ZF, SF, OF. Насчёт VPTEST — да, не подойдёт.

31.05.2023

disba1ancer

КТ315
Так тебе всего-то нужны флаги ZF, SF, OF. Насчёт V...

У него операнды в xmm

31.05.2023

s54820

Конвертировать в signed и сравнивать, например. Конвертировать можно, изменив старший бит или вычитая половину диапазона (sub/xor с 0x80...000). Это плюс несколько инструкций, но одной-двумя всё равно не получится.

31.05.2023

s54820

Dog_with_a_Tail
Сравнить то нужно, но вот нигде никакие флаги не з...

Можешь посчитать с переполнением и без переполнения и сравнить. Но получится примерно то же по количеству инструкций: movdqa xmm2,xmm0 paddw xmm0,xmm1 paddusw xmm2,xmm1 pcmpeqw xmm2,xmm0 ; плюс что-то делаем с маской в xmm2

31.05.2023

Dog_with_a_Tail Автор вопроса

s54820
Можешь посчитать с переполнением и без переполнени...

так проблема в сравнивании опять же, маска xmm2 будет либо строка едениц, если xmm2 == xmm0, либо строка 0, если соответственно не равны, флаги не трогаются какие либо

31.05.2023

s54820

Dog_with_a_Tail
так проблема в сравнивании опять же, маска xmm2 бу...

А что тебе потом делать-то нужно? Маска в таком виде специально формируется, потому что самый частый следующий шаг - инвертировать маску если нужно, потом замаскировать и заменить часть упакованных значений.

31.05.2023

Dog_with_a_Tail Автор вопроса

s54820
А что тебе потом делать-то нужно? Маска в таком ви...

Изначальная цель - сложить, узнать есть ли оверфлоу

31.05.2023

s54820

Dog_with_a_Tail
Изначальная цель - сложить, узнать есть ли оверфло...

Но ты ведь можешь забрать маску pmovmskb в обычный регистр.

31.05.2023

Dog_with_a_Tail Автор вопроса

s54820
Но ты ведь можешь забрать маску pmovmskb в обычный...

А я балбес, видимо, мне переполнение в unsigned сложении надо определить

31.05.2023

s54820

Dog_with_a_Tail
А я балбес, видимо, мне переполнение в unsigned сл...

Так я же предложил решение, что с ним не так? Ну кроме того, что длинное. Если точное место переполнения не интересует, то можно сократить на пару инструкций, отложив финальную проверку до конца цикла.

31.05.2023

Dog_with_a_Tail Автор вопроса

s54820
Так я же предложил решение, что с ним не так? Ну к...

ааааа, пришлось открыть глаза чтобы понять, что написано. Осталось понять как узнать старший бит, менять понятно как

31.05.2023

s54820

Dog_with_a_Tail
ааааа, пришлось открыть глаза чтобы понять, что на...

movdqa xmm2,xmm0 ; paddw xmm0,xmm1 ; С переполнением. paddusw xmm2,xmm1 ; С накоплением. pcmpeqw xmm2,xmm0 ; 11..11 совпало, 00..00 нет. pmovmskb eax,xmm2 ; Старшие биты каждого байта маски. cmp (или xor) eax,0xffff ; 2 (одинаковых) бита на слово, 8 слов. jnz overflow ; И там какое-нибудь tzcnt/bsf, если надо. Наверняка быстрее можно, если что-то поновее SSE2 взять. Но надо думать/мерять.

31.05.2023

Dog_with_a_Tail Автор вопроса

s54820
movdqa xmm2,xmm0 ; paddw xmm0,xmm...

Гипотетическая ситуация: xmm0 задан старший бит, а у xmm1 не задан, а в unsigned сумме переполнения нет. После paddw и paddusw в xmm0 и xmm2 будут лежать разные числа => дальше пойдем по логике overflow, однако переполнения в реале нет. Во избежание такого, нужно конвертировать числа из unsigned в signed, как и было уже написано тобой, но просто ксорить или вычитатать нельзя, потому что теряется информация о старшем бите, который как раз и определяет будет ли переполнение или нет. А считать старший бит xmm регистров без avx512 невозможно (или я уже не знаю)

02.06.2023

s54820

Dog_with_a_Tail
Гипотетическая ситуация: xmm0 задан старший бит, а...

А почему будут разные-то? Давай для двухбитных: 10 + 01 = 11, с накоплением тоже 11. И нет, при преобразовании в signed сдвигом диапазона ничего не теряется, просто телодвижений больше.

02.06.2023

Dog_with_a_Tail Автор вопроса

s54820
А почему будут разные-то? Давай для двухбитных: 10...

когда переходим из unsigned в signed 2^128 -> 2^127 - 1 бит под знак. По этой же причине будут и разные результаты, потому что число с заданным старшим битом будет как отрицательное во время paddw

02.06.2023

Похожие вопросы

Ассемблер / КТ315

Я говорю, что вот эта оптимизация инструкций от компилятора - это показуха, он не оптимизирует алгоритмы, глупый он ещё. А если алгоритмы не оптимизирует - какой прок с него? ...

#assembler #programming #russian

05.09.2024

107 ответов

Ассемблер / A A

А можете как-то проверить меня по знаниям по ассемблеру?

#assembler #programming #russian

12.08.2024

132 ответов

Ассемблер / Mixail Frolov

мне то зачем? я отладчиками вообще почти не пользуюсь

#assembler #programming #russian

21.08.2024