задачу?
Есть текст, например, «Мама мыла раму. Мама моет стекла в раме. Мама будет мыть подоконник завтра». К этому тексту есть реальные вопросы и псевдовопросы в виде неоконченных фраз. Вопросы и псевдовопросы (по условию моей задачи) имеют общую цель: на любой из них можно ответить неизмененным фрагментом исходного текста.
Пример реального вопроса: «Что делает мама?». Примеры ответов: «Мама моет стекла в раме», «Мама моет стекла», «Моет стекла», «Моет стекла в раме». Все 4 ответа правильные. Как сделать так, чтобы gpt генерировал все эти 4 ответа сразу? Сложность в том, что это количество заранее неизвестно.
Пример псевдовопроса к тексту: «И подоконник тоже...». Пример ответа: «...мама будет мыть». При этом ответ «...мама будет мыть завтра» уже является неверным, потому что в начале фразы есть союз «и», который не дает возможности говорить про "завтра".
Есть у кого-то идеи: как решить мою задачу хотя бы с вопросами? Если она будет решена еще и для псевдовопросов – будет вау!
Если нужно отвечать неизменным фрагментом исходного текста, т.е. цитированием без фантазий. Для этого нужно установить температуру в 0.
С температурой понятно. Но как проверить, что все 4 варианта найдены, если это число 4 заранее неизвестно?
а с чего вы взяли что их 4 всего...
См. пост выше с примером. Там 4. Для примера :)
Еще как минимум "моет" и "мама моет"
Ну... совсем не содержательно получается. Но формально, да, правильно.
вы можете найти конкретное предложение содержащее ответ, разложить его на pos зависимости (наташей или спейси например) и собрать ответы доьавляя зависимые слова
Конкретное предложение найти точно не проблема (в датасете есть верный ответ), а про остальное можно поподробнее? Ведь может не только зависимых слов не хватать, но и подлежащего, и сказуемого.
в предложении "мама моет стекла в раме" есть глагол который посути и есть ответ на вопрос, дальше от него можно пгружаться в связанные слова с помошью dfs
Температура в 0 не спасет от галлюцинаций.
Если мы говорим про конкретный текст и конкретный вопрос, то вы правы: от глагола можно плясать. Но у меня конкретных текстов 3 книги, и конкретных вопросов 3000 во всем датасете! Как мне автоматизировать все это? :)
Я думаю надо подсовывать по предложению, а не несколько сразу.
Обсуждают сегодня