в качестве эмбеддингов. Как это правильно/лучше варить?
2) Какие бест практики по запихиванию композиций эмбеддингов (текста) в сетки или еще куда?
В сети какой только экзотики не встретишь: от w2v эмбеддингов, взвешенных по tfidf и засунутых в хгбуст, до магии от тф, где задаешь слой embedding и он сам как-то учит представления слов в процессе.
смотри
Можно посмотреть курсы по nlp, от Самсунга на степике хороший (там от bow до bert всё есть) Или cs224n от стенфорда. И вот ещё вот этот хвалят http://lena-voita.github.io/nlp_course.html
https://github.com/yandexdataschool/nlp_course/ добавлю лекции, семинары, дз Первые 5 лекцах на пальцах. Дальше сложнее
Обсуждают сегодня