169 похожих чатов

Xor eax, eax @@: movups xmm0, xword[buf+eax] pxor xmm0, xword[xmm01] ; db 16

dup(0x1)
movups xword[buf+eax], xmm0
add eax, 16
cmp eax, sizeof.buf
jb @b

= 28525, 30768, 30269

Вариант с xor byte[buf+ecx], 0x1
= 1300, 930, 831

Странно... Может у меня у одного так?

18 ответов

5 просмотров
Entusiast- Автор вопроса

Всё. Понял)) Сунули туда SIMD фиг пойми вообще зачем... Всё верно - это одна работа с памятью, вот и потери в тактах. "Единственное, где может пригодится AVX инструкции - маппинг bad block'ов"

но код очень грубый, легко выходит за границу массива

Entusiast- Автор вопроса
disba1ancer
так он с памятью быстрее работает

Нет, медленнее. Или там промах в кэше был, или этот SIMD не годится на такое (С кэшем всё в порядке)

Entusiast- Автор вопроса
disba1ancer
так он с памятью быстрее работает

Всё, я разобрался. 1. Потеря в тактах не на 30 000, я не сбросил конвейер (использовал старый алгоритм, и сам забыл), а на 100-200 нс. 2. Код можно было оптимизировать так: movups xmm1, xword[xmm01] (Дальше цикл) pxor xmm0, xmm1 И при таком условии уже идёт обгон на 150 нс., в отличии от алгоритма с xor byte[buf+ecx] Так что MSVC был близок к победе, но не доковылял.

Entusiast
Всё, я разобрался. 1. Потеря в тактах не на 30 000...

Если ты от gcc хочешь получить sse юзай -O3

Entusiast- Автор вопроса
Entusiast
screenshot Спасибо, заюзал

Это на O3 вчера было

Entusiast
Это на O3 вчера было

Ты что-то делал не так

Entusiast- Автор вопроса
disba1ancer
Ты что-то делал не так

Конечно, я виноват!!

Entusiast
screenshot Спасибо, заюзал

Тут должен быть sse, хотя если у тебя -m32

Entusiast- Автор вопроса
disba1ancer
Тут должен быть sse, хотя если у тебя -m32

С m32 SSE тоже выдавало, и нет там не должно быть SSE, и да этот код медленный, потому что GCC любит работать со стэком, когда не надо, и любит возвращать значение в любых условиях обратно в память, даже когда его не просят. Впрочем, как и другие компиляторы

Entusiast- Автор вопроса
disba1ancer
Где-то что-то явно не так

Да пожалуйста! Могу тебе скинуть всё, сам скомпилируешь

Entusiast
Да пожалуйста! Могу тебе скинуть всё, сам скомпили...

Ты в курсе что код подредактирую для получения лучших результатов?

Entusiast
Давай

Но вообще мне лень этим заниматься, но хочешь скинь, только не в личку

Похожие вопросы

Обсуждают сегодня

а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
Добрый день. Хочу сделать отрисовку по команде на панели. Почему-то рисуется только при втором вызове. С чем может быть связано, не подскажете? procedure TForm1.FormDblClick(...
Kirill Filippenok
20
Всем доброго дня! Подскажите может кто использовал связку Pagebuilder + Clientsetting. Сами параметры с типом pagebuilder в модуле Clientsetting работают нормально, можно такж...
Александр Добриков
12
А почему в си некоторые вещи работают с двойными кавычками некоторые с одинарными? Нельзя было все сделать с одними или чтоб работало с разными? например чтоб выводить строки ...
.
15
Всем привет! Нужен совет от опытных. Переношу свой проект с Делфи 10.2 Токио на Лазарус 3.2 установленный через инсталлятор fpcupdeluxe-x86_64-win64. При импортировании проект...
Дмитрий Завгородний
7
Эх кто-то пришел и весь праздник испортил :( You need complex FBX scene importing setup to change things on import? good luck with that. You need navigation and pathfinding? g...
Serg Gini
5
Всем привет! procedure TForm1.FormCreate(Sender: TObject); type TStartEnd = record S: Byte; E: Byte; end; var a, b: TStartEnd; begin {1} a.S := 1; {2} a.E := 2; ...
Руслан Михайлович
10
Всем привет!) я тут новенький и пытаюсь освоить evolution методом тыка. У меня при переходе между папками файлов выскакивают вот такие уведомления Можете подсказать как их от...
Диман Samoed
10
Всем привет! Подскажите. Я написал приложение на Delphi 10.2 Tokyo под Windows 10. И передо мной стал вопрос о том чтобы сделать это приложение кроссплатформенным (под Linux и...
Дмитрий Завгородний
24
Какого хера? /Sources/App/Modules/User/Models/UserLinkApple.swift:21:20: warning: stored property '_id' of 'Sendable'-conforming class 'UserLinkApple' is mutable @ID(...
Alexander Sherbakov
14
Карта сайта