надо либо откуда-то загрузить большой словарь всех слов, либо создать свой словарь, который наберет все слова из твоего датасета, присвоит им индексы, а потом можно будет набрать бэг оф вордс, а потом фулли-коннектед - который непонятно как обучать, он же будет здоровый...
В общем, как это делается по-русски?
w2v в помощь
Обсуждают сегодня