Что такое SWE?
Мы считаем, что "надо" знать, что интеграл от 0 до 1 x^n это 1/(n+1) или не надо?
И что? Это - не обоснование. Вот есть у меня объекты и метки, просят выдать вероятность. А потом возникает вопрос, с чего это именно log-loss оптимизируется на валидации? Чем ...
И вот ты такой клевый стоишь в какой-нибудь точке и вычисляешь градиент функции. Что будет, если ты домножишь его на слишком большой learning_rate? Правильно, несмотря на то, ...
А экспериментально то же самое никак?
Да ладно, много "математиков" реально понимают формализм теории множеств?
Модель? Модель. Экспериментами подтверждается? Подтверждается. Ну всё.
Хз. Сколько там зп нынче? 150-300к в месяц?
apt download <package_name> на машине с инетом и через флешку не?
Там хорошие учебники есть хоть один?
Почему log-loss, а не MSE или еще что-то при предсказании вероятностей меток?
Что такое интуиция в принципе?
Кстати, интересно. Кострикин, Винберг как?
Типа узкая тема слишком?
А гудфеллоу Вам как?
Метод Максимизации Правдоподобия?
Что такое "мера хаоса"?
По математике?