w2v? Это же вроде очень специфичный пример, а в среднем сумма даже двух слов мало что дает?
Фишка как раз не просто в сложении слов, а в модификации вектора слова в определённом направлении. Например, направление "-man+woman" соответствует более женским словам, а направление "-краснота+красный" соответствует переходу от существительных к близким к ним по смыслу прилагательным. А вот композиционности ("красный + пиджак" и т.п.) в word2vec как раз-таки нет.
А, ну в этом смысле да, оно и правда работает - если складывать эмбеддинги в структурно схожих фразах, то и результат будет схожим. А "композиционность" - это то, как лингвисты называют вычисление совокупного смысла фразы по отдельным её составляющим. И это то, что word2vec понимает плохо. Возьмём, например, фразу "прогревание больного места". Она обозначает процесс прогревания, но если вычислить сумму векторов "прогревание+больное+место", то результат будет похож и на вектор для "больной человек", и на вектор для "место в пространстве", потому что мы никаким образом не показали, что слово "прогревание" здесь главное, а "больное место" - дополнительная, уточняющая часть.
спасибо! понял теперь. аналогично, "Василий нашел замок", тут вообще не разгадает.
Обсуждают сегодня