что функции активации у нейронов имеют свои весовые коэффициенты, которые обучаются вместе с основными коэффициентами?
Например, такая функция активации. f(x, k) = abs(kx) / (1 + abs(kx)). Коэффициент k изменяется во время обучения и таким образом по идее выбирается оптимальная функция активации для текущей задачи.
PRelu?
Пример с abs() вообще бессмысленный, там умножение на k дает просто изменение масштаба
Обсуждают сегодня