4 итерациями очень медленный с n_jobs=-1. Есть какой то способ уменьшить время его работы?
Выбрать другую библиотеку
scikit-learn
Там нет kmodes для categorical data
Попробуй one-hot энкоднуть данные, и потом применить kmeans
Это и сделано с MultiLabelBinarizer но нужно создать кластеры и вычислить prediction. Kmodes это позволяет как я понял
>вычислить prediction Я так понимаю, ты хочешь получить вероятность того что новые данные относятся к тому или другому классу?
Обсуждают сегодня