понял, как. У меня 1500 итераций, и лернинг рейт был 0.001. Итерации до 500 - cost func. = нормальные значения, итерации после 500 - cost. func. = nan. Я изменил лернинг рейт на 0.0001 и у меня в каждой итерации получились нормальные числа. Почему так?
Причина осталась - в логарифме по прежнему возможен минус ноль. Только изменив ЛР, ты до него дойти не успеваешь. Попробуй 5000 итераций
Обсуждают сегодня