А существует вообще какая нибудь книга, в которой собрана со всех мест реально нужная БАЗА для DS?
Вопрос. Есть ~200 фичей, из них ~20 имеют 85%< пропущенных значений - их имеет смысл оставлять или лучше удалить?
Да что ж вы такой неугомонный, Игорь?) Я устал повторять, что окончание вуза другими не признак дальнейшего успеха в карьере! Если бы 70% руководителей имели по золотой медали...
ебаааа, откуда такая кибератака на этот безобидный чат?!
Я, без обид, не могу не спросить)) Михаилу еще никто не говорил, что вот это вот все - это не его?)) Чисто мое мнение 🙃😃
А не подскажите, используются ли сетки военными для опознавания вражеской техники или вражеских солдат? Российскими, китайскими, американскими войсками? И как они используют -...
Почему с полностью везде зафиксированными сидами модель выдает разные результаты обучения? seed в параметрах модели и в разбивке на фолды зафиксирован и даже использована вот ...
.sort_values()?
Лучше подскажите кто-нибудь, как освободить оперативную память после использования parallel_apply?)
Народ, как максимально быстро посчитать такие функции, как skew и kurt при группировке? Использую cudf, но все равно работает очень медленно - df.groupby(col)[col2].apply(lamb...
С каких пор способность закончить вуз что-то означает? В вузах по сути деградация
Тогда получается чтобы проверять значимость фич, лучше использовать colsample приближенный к 1?
А это где у вас попросили просто фит-предикт?))
А с российской картой я так понял подписку в гугл колабе не оформить?
Тогда зачем в принципе esr, если при наличии ресурсов можно поставить ради эксперимента хоть 20000 итераций? Все равно сохранится лучшая
Кто нибудь писал callback на catboost? Не понимаю, как вытащить каждую итерацию
Ховно или реально стоит прохождения?