170 похожих чатов

Коллеги, всем привет ) вытаскиваю короткие текстовые запросы по контекстной близости первоначальная

идея заключалась в том, что нужно вытащить запросы, близкие по контексту , например, к "Не подтвердить адрес проживания".
Предполагалось, что по контекстной близости близкими будут примерно такие
"Не получается подтвердить адрес"
"Не могу подтвердить адрес"
"Подскажите, как подтвердить адрес",
то есть упор на "подтвердить адрес"

Так оно и получилось
НО (!):
"Не могу подтвердить электронный адрес",
"Не могу подтвердить ... "(еще что-то там
также оказались близкими, так как в них есть "не могу подтвердить",
но это совершенно другой тип запроса.

Кто сталкивался с подобной ситуацией?

Как выделять контекстную близость именно про "подтвердить адрес",
а не про "не могу подтвердить"?

4 ответов

6 просмотров

Сталкиваюсь постоянно. Пробовал два пути решения, оба работали (в том числе и в комбинации): 1) Дообучение энкодера предложений на собственном датасете на задачу metric learning: сближать эмбеддинги пар предложений из одного класса, и отталкивать эмбеддинги пар из разных. Работает хорошо, но можно нечаянно сломать энкодер, особенно если есть классы, состоящие из очень разнородных по смыслу примеров. 2) Не менять энкодер, но изменить формулу для расчета близости: например, из близости пары предложений вычитать (или делить на) среднюю близость k ближайших соседей каждого из них (как в статье Artexte и Schwenk ), чтобы оштрафовать примеры, которые хоть и похожи на ваш, но есть и другие, ещё более похожие.

Anatoly-Belov Автор вопроса

А вы не пробовали так подойти: 1. рассматривать полученные по запросу результаты, как кандидатов 2. применить к кандидатам NLI. Причем тут вариантов появляется множество

Anatoly-Belov Автор вопроса

Похожие вопросы

Обсуждают сегодня

Интересно, нет ли какого-то способа получить из dll не адрес самой метки, а адрес со смещением?
The Bird of Hermes
54
Делал задачу вот такую https://stepik.org/lesson/4985/step/9?unit=1083 получилось такое https://play.haskell.org/saved/ipKrepqe оно работает, тестов много не писал, но работае...
Fedor
5
Почему спрашиваю - поймал падение на совершенно уже пустом проекте, хочу до минимального повторяемого свести... Такой вопрос - вот эти юниты, перечисленные в инспекторе объек...
notme
6
Anyone here suffers from unexplained aural migraines, who would be up for talking for a bit? Doesn't *have* to be aural, but I am not asking about headaches, I mean actual mi...
Martin Rys
58
Сообщение* в закодированном виде. То есть, просто сделать sendMessage?text=Привет бла-бла! не получится, надо в HEX переводить, и добавлять процент, типа такого: sendMessage?t...
КТ315
21
А случайно нет ли в паскале штатной возможности передать указатель и количество туда где array of в качестве аргумента?
zamtmn
25
Друзья, за кем?
Magic
12
А шо, ты этой библиотекой пользуешься?
Darkanronpa Dark Hole
10
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Всем привет. Кто-то может подсказать, как можно перевести значения Selection поля, если список значений в нем формируется динамически? Я изначально их получаю из selection дру...
Наталья Селезнева
6
Карта сайта