1) не факт, что компилятор сделает вычисление Bij * Anj * alpha однократным. Как минимум общую часть можно вынести за циклы. 2) в принципе, можно Bij * A[n, j] * alpha переписать как векторную операцию, чтобы само внутри оптимизировалось 3) θ[m, n] += A[m, i] * можно попробовать заменить сложением двух матриц. С той же целою - переложить оптимизиацию на Джулию 4) если матрицы большие, то пункты 2 и 3 могут создать проблемы с памятью…
Обсуждают сегодня