блокнот сразу вылетает
Можно попробовать спросить здесь: @catboost_ru
Там получается разреженная матрица размера словаря(огромная) , скорее всего выбрасывает при попытке to_dense. На мешке слов советуют линейные модели поэтому. Для бустингов можно сначала скачать предобученные эмбеддинги для слов, к примеру glove, для текстов усреднить по словам и посмотреть качество.
Если просто работа с текстом и нет остальных признаков каких-то, то советую попробовать предобученную bert использовать
Обсуждают сегодня