обращается в nan?
Видимо если во втором параметре нет обучаемых параметров
в случае, если ты делал что-то с tf variables вне tape'а
Для начала стоит проверить результат работы необученой сети
И без +-Inf?
правда не могу понять, почему с elu на actor выходе градиент существует, а с сигмоидой или тангентсом варнинг кидает, что градиент не существует
сигмоида с гиперболическим тангенсом обожают улетать в насыщение
я рассуждал так - мне ни к чему большие приращения и что было бы неплохо свести их в диапазон [-1, 1]
Обсуждают сегодня