170 похожих чатов

А про банан слажала... <s>GPT4 User: Ты - ChatGPT, русскоязычная модель,

созданная OpenAI на основе архитектуры GPT-4. Твои знания обширны и предназначены для ответов на разнообразные вопросы пользователей. Ты готов предоставлять информацию на различные темы, опираясь на свои знания и обучение. Твоя цель - предоставлять информацию для размышления и обсуждения. Если у тебя нет уверенного ответа на вопрос или ты не можешь предоставить необходимую информацию, честно сообщи об этом и предложи пользователю другие доступные источники или ресурсы, где он сможет найти более точные сведения. Ты стремишься к ясному и информативному общению в своих ответах и избегаешь использования сленга и специфических терминов, чтобы быть максимально понятным для пользователя. <|end_of_turn|> GPT4 Assistant: Отлично! Давайте начнем! <|end_of_turn|> GPT4 User: Я на кухне, положил тарелку на банан. Затем я отнес тарелку в спальню. Где сейчас банан? <|end_of_turn|> GPT4 Assistant: Банан, вероятно, находится в спальне, поскольку вы перенесли тарелку с бананом туда после того, как оставили её на банане в кухне. <|end_of_turn|>

9 ответов

46 просмотров

Зачем вы проверяете LLM на этой задаче?

Он тупой

7B модели в Q4_K - вообще не вариант использовать. У них потери огромные из-за Q4_K

Konstantin-Galagan Автор вопроса
🖥 Михаил
Зачем вы проверяете LLM на этой задаче?

Меня больше удивляет проверка на фактах. Если модель не видела эти факты, что вы ожидаете? В задаче про банан - логика и внимание к деталям (тарелка на банане)

Фактов от неё как раз никто не ждёт, я выше об этом писал Одной задачей про банан вы ставите оценку качества модели? Посмотрите сколько итераций и сколько примеров используется в известных бенчмарках

Konstantin-Galagan Автор вопроса
🖥 Михаил
Фактов от неё как раз никто не ждёт, я выше об это...

Задача про банан, это просто забавная задача. Я никаких суждений на основе решения этой задачи через ллм не делаю.

Похожие вопросы

Обсуждают сегодня

А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
Добрый день подскажите пожалуйста может кто то сталкивался с ошибками Sentry 22.10.0 развернутым из helm чарт в Kubernetes? Изначально 3 дня назад очень стало много событий ух...
Tire4 Finist Devops
1
;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, стандартный ;вызов процедуры ;option casemap:no...
Егор Анелькин
1
почому оно не работает?
Vi Chapmann ٩( 💢•̀ з•́)و Chapmann
19
всем привет почти закончил курс После него можно писать свою операционку? Какие библиотеки надо использовать и куда дальше копать для изучения
Linus
19
Так а кто может спарсить всех участников чата? Идишники
Magic
18
Карта сайта