чтобы модель могла сказать "я незнаю" вместо выдумывания ответа?
Вроде были какие-то papers на тему повышения достоверности ответов ЛЛМ с использованием human reinforcement Но ЛЛМ стремится "предсказать" следующий токен, а не дать достоверный ответ. Так что в теории, наверное это и возможно, и скорее всего на arxiv лежит несколько papers на эту тему, а на hugging face есть хотя бы один датасет / модель. Но вряд ли это распространенно, вспоминаем случай Galactica которую за неумение говорить не знаю и выключили. Извиняюсь, что мог дать косой ответ, я сам занимаюсь НЛП и ЛЛМ как хобби в свободное время от учёбы и работы.
Посчитайте перплексию/засемплите n генераций
Есть, мы сделали, говорит(независиммг локальная LLM или апи). Хотя и Чатгпт тоже говорит иногда, ее же обновляют постоянно
Ну и статья есть ещё https://arxiv.org/abs/2306.03341#
Да что-то вроде этого мне приходило в голову
Обсуждают сегодня