Traceback (most recent call last)
_catboost.pyx in _catboost._FloatOrNan()
TypeError: float() argument must be a string or a number, not 'NAType'
During handling of the above exception, another exception occurred:
TypeError Traceback (most recent call last)
_catboost.pyx in _catboost.get_float_feature()
Понял, спасибо за ответ,а то уж не знал, в чём проблема. В общем, народ, если у вас новый pandas, работающий рецепт, похоже, один: сначала заполняем NaN-ы во всех НЕКАТЕГОРИАЛЬНЫХ и НЕТЕКСТОВЫХ столбцах на спецзначение: NA_FILLER = -666 for col in tqdm(df.columns): if col not in cat_features and col not in text_features: df[col].fillna(NA_FILLER, inplace=True) np.nan не катит потом уже при желании в конвейере по ним добавляем imputer, к примеру, DataFrameMapper( [ ( [col for col in df.columns if col not in cat_features + text_features], SimpleImputer(strategy="constant", fill_value=0, missing_values=NA_FILLER), ) ],)
Только лучше float('NaN') использовать
Обсуждают сегодня