у вас на каком-то датасете, и как ответить на вопрос, это из-за того, что у вас активационная функция хорошая, или просто процесс оптимизации пошел по-другому, и отыскался чуть более глубокий локальный минимум. А на другом датасете может получиться чуть хуже и что, выбрасывать вашу классную активационную функцию?
Так кросс-валидация же
1) Проводить не один эксперимент, а несколько, а результаты усреднять и добавлять в таблички дельты 2) Провести эксперименты на разных архитектурах сети 3) Провести эксперименты на большом количестве разных датасетов 4) Попробовать доказать что-то теоретически, исходя из математических свойств функции Но это всё варианты не для дипломной работы за месяц
Обсуждают сегодня