пример линейных) ?
Представление слова в виде вектора понятно и достаточно естественно сейчас не так ли естественно и представление слова как оператора(для начала на пример линейного).
В теории групп представления их в виде линейных операторов важная часть теории.
Наличие того или иного слова воздействует на текст и смысл других слов рядом и тут очень естественно смотрится операторное а не только векторное представление.
Я искал сам но ничего подобного не нашел.
Искал на ресурсах paper with code и на arxiv но ничего к сожалению не нашел.
вам легче пойти на реддит или профильные англоязычные ресурсы с таким вопросом, но если нет ни одной работы на arxiv то тут два случая: 1. Вы гений, срочно оформляйте работу 2. Это видимо все же не так очевидно
Действительно, операторное представление слова не настолько распространено, как векторное представление. Векторное представление слова имеет множество преимуществ, таких как простота расчетов, возможность работы с методами машинного обучения и т.д. Тем не менее, можно наткнуться на некоторые статьи, которые используют операторное представление слова. Например, статья "On Operator-based Compositionality in Word Embeddings" авторов Luca Di Liello и Marco Baroni. В этой статье авторы исследуют, как операторные методы могут использоваться в векторном представлении слов. Также можно обратить внимание на работу "A Linear Operator Model for Compositional Distributional Semantics" авторов Mehrnoosh Sadrzadeh, Edward Grefenstette и Dimitri Kartsaklis. В этой статье авторы описывают свою модель, в которой слова представляются в виде линейных операторов, и изучают ее применение для анализа семантики. Несмотря на то, что операторное представление слова не настолько просто в использовании, как векторное представление, оно по-прежнему может приносить пользу в некоторых областях исследования. Ответ чатгпт
Тут вероятно куча технических тонкостей которые препятствуют эффективному использованию такого представлению. По существу же здесь нет ничего нового.
Вы уверены что эта статья существует ? Я несколько раз сталкивался с тем что chatGPT фантазирует. Проверил первую статью и не нашел её. Вторая статья 2010 года.
https://link.springer.com/chapter/10.1007/978-981-15-5573-2_2 Word2vec использует векторное представление для слова, а соседние слова (фраза например) представляется в виде матрицы. Если очень захотеть, то можно такие матрицы анализировать как линейные операторы. Например, можно предположить что собствееные значения такой матрицы будут представлять наиболее часто употребляемые выражения в тексте.
я проверил только первого автора (и не утверждал, что статьи существуют) https://lucadiliello.github.io/
не очень только понимаю какую проблему это решает
Линейный оператор вроде матрица
А word2vec знаю но там и во многих других случаях именно векторное представление слов. Смысл именно операторного представления что оно может быть в чем то более естественно и значит в каких то случаях более эффективно. Русский произошел от глаголицы а здесь уже в корне глагол значит действие. А аналог действия именно оператор а не вектор. Все это надо пробовать и смотреть.
напоминает выступление Задорнова, на тему что спина от слова спать, поэтому спать надо на спине.
У Вас есть доказательства что это не возможно и заведомо неэффективно? Если мало кто так делает это может быть по банальный причине руки просто не дошли.
Есть ощущение, что идейно ничего не измениться. С точки зрения математики скорее всего буду неправ, но идейно какая разница как представлены числа, в виде матрицы или развернуты в вектор, они все равно на каждом слое будут умножаться на соответсвующий вес и будет нелинейность после, слой за слоем
Ну последовательное умножение операторов , может давать новый оператор который соответствует воздействию двух слов ... Мне честно операция сложения векторов для образования новых смыслов кажется неестественной.)
Сейчас взаимодействие слов в тексте описывается гораздо сложнее даже линейного оператора)
Здесь проблема в том, что если у нас в середине предложения слово, смысл которого мы неправильно распознали, или какое нибудь бессмысленное междометие, то одно такое слово нам сломает всю цепь, и значение произведения операторов получится некорректным
Вот если подмешивать к векторному представлению операторное представление соседних пар или троек слов - то из этого может что-то получиться
Я не говорил что операторное представление должно быть основным, оно может быть как дополнение в виде отдельной подсветки.
100%, главный вопрос который должен встать это не сама попытка это сделать а смысловая нагрузка которую несёт это действие. Опять же чем плохи векторы?
Тем что они векторы.) Вся математика это теория структур и их связей. Почему в ней так важны именно функции а не только числа. Почему математике было не обойтись арифметикой? Почему в программировании есть и список,стек, хеш ... Можно привести много других примеров когда используются разных структур а не только одна. Если кратко то другая структура может дать дополнительные корреляции и новые фичи. Неправильная структура может больше мешать чем помогать ... но это нужно проверять и пробовать.
В чём проблема-то , открытых данных - завались, целиком NLP моделей тоже, заменяйте там эмбеддинг на какой угодно и пробуйте?
Кто сказал что есть проблема? Просто спросил встречал ли кто то такое представление. Я не знаю правильно или нет, дойдут руки попробую реализовать. Даст выигрыш хорошо, нет тоже ничего страшного.
Так вы даже суть идеи не объяснили, сказали только что "хочу оператор". Запишите 100- мерный вектор из word2vec как матрицу 10x10 вот и пожалуйста, оператор, чего дальше?
Следует жить, шить сарафаны и легкие платья из ситца. ) — Вы полагаете, все это будет носиться? — Я полагаю, что все это следует шить.)
Обсуждают сегодня