а в старых ?
что? и системные таблицы тоже на innodb переехали?
да? а я только хотел порадоваться что такой коммунизм настал :))
if params["bootstrap_type"] == 'Bernoulli': params['subsample'] = trial.suggest_float('subsample', 0.3, 0.8) params['sampling_unit'] = trial.suggest_categorica...
типа поднять в докерах clickhouse, airflow и что дальше?
Привет! Извините за вопрос - но как в ch сделать аналог "limit 1 over (partition by X order by Y)", т.е. полчить топовую строку из каждого окна по X отсортированного по Y ?
Всем привет! Может кому-то будет интересно. Есть возможность выступить на РИТ (http://ritfest.ru/) 5-6 июня в Сколково. Анонс секции звучит так: "Отдайте роботу работу! Кейсы ...
когда я задавал такой же вопрос - мне посоветовали выбрать те параметры при которых тест-скор выходит "на плато", не?
итераций с учетом сплитов на кросвалидации? или имеется ввиду 200 комбинаций параметров?
я изучил распределение по классам, выкинул аутлаеров. что еще можно "сбалансировать"?
кому интересна модель где для каждого объекта свой лист на одном из 1000 деревьев ?
У кого нибудь есть желаение стать спикером на Data-science митапе?
т.е. ROC 0.99 на train и 0.75 на валидации это нормально?
а на миллионе деревьев разве не будет?
может кто нибудь знает еще подобные проекты?
а в какую сторону думать?