у нас one-hot, |Y|=n. При этом мы хотим чтобы сеть знала, когда она не знает что перед ней. Знаю подход, когда для этого кидают n+1 лейбл и учат всякий мусор складывать туда. А на сколько адекватно, просто кидать пустой лейбл (все нолики у Y)? На выходах сигмоида.
Сигмоида дает вероятность принадлежности к классу. Поэтому если на всех выходах вероятности, близкие к нулю, то это говорит о том, что вероятность принадлежности к известному классу также близка к нулю.
Обсуждают сегодня