170 похожих чатов

private static int CountTriples256v2(int[] arr, int

sum)
{
int n = arr.Length;
int count = 0;
var vCount = Vector<int>.Count;
ref int p = ref arr[0];
var sumVector = new Vector<int>(sum);
for (int i = 0; i < n; i++)
{
for (int j = i + 1; j < n; j++)
{
var ijSum = arr[i] + arr[j];
var ijSumVector = new Vector<int>(ijSum);
var k = j + 1;
for (; k < n - vCount; k += vCount)
{
var kVector = Vector.LoadUnsafe(ref p, (nuint)k);
var ijkSumVector = kVector + ijSumVector;
var subResult = Vector.Equals(sumVector, ijkSumVector);
if (subResult != Vector<int>.Zero)
{
var sumCount = Vector.Sum(subResult);
count -= sumCount;
}
}

for (; k < n; k++)
count += ijSum + arr[k] == sum ? 1 : 0;
}
}
return count;
}

6 ответов

40 просмотров

Vector.LoadUnsafe(ref p, (nuint)k) это уже на грани байтоёбства

EgorBo- Автор вопроса

4х хуже

EgorBo
4х хуже

Чот я потестил, 225+-

EgorBo
4х хуже

private static int CountTriples512v3(int[] arr, int sum) { int n = arr.Length; int count = 0; var vCount = Vector512<int>.Count; ref int p = ref arr[0]; var sumVector = Vector512.Create(sum); for (int i = 0; i < n; i++) { for (int j = i + 1; j < n; j++) { var ijSum = arr[i] + arr[j]; var ijSumVector = Vector512.Create(ijSum); var k = j + 1; for (; k < n - vCount; k += vCount) { var kVector = Vector512.LoadUnsafe(ref p, (nuint)k); var ijkSumVector = kVector + ijSumVector; var subResult = Vector512.Equals(sumVector, ijkSumVector); if (subResult != Vector512<int>.Zero) { var sumCount = Vector512.Sum(subResult); count -= sumCount; } } for (; k < n; k++) count += ijSum + arr[k] == sum ? 1 : 0; } } return count; } вот это хуже но не в 4x

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта