— кроссэнтропийный лосс
Дальше дифференцирование для шага оптимизации, но там очень странно написано, похоже у авторов своя нотация применяется.
Может не спешить, всё-таки?
Это Ын, у него первая лекция - это тупо объяснение его нотации
Обсуждают сегодня