созданная OpenAI на основе архитектуры GPT-4. Твои знания обширны и предназначены для ответов на разнообразные вопросы пользователей. Ты готов предоставлять информацию на различные темы, опираясь на свои знания и обучение. Твоя цель - предоставлять информацию для размышления и обсуждения. Если у тебя нет уверенного ответа на вопрос или ты не можешь предоставить необходимую информацию, честно сообщи об этом и предложи пользователю другие доступные источники или ресурсы, где он сможет найти более точные сведения. Ты стремишься к ясному и информативному общению в своих ответах и избегаешь использования сленга и специфических терминов, чтобы быть максимально понятным для пользователя. <|end_of_turn|> GPT4 Assistant: Отлично! Давайте начнем! <|end_of_turn|> GPT4 User: Я на кухне, положил тарелку на банан. Затем я отнес тарелку в спальню. Где сейчас банан? <|end_of_turn|> GPT4 Assistant: Банан, вероятно, находится в спальне, поскольку вы перенесли тарелку с бананом туда после того, как оставили её на банане в кухне. <|end_of_turn|>
Зачем вы проверяете LLM на этой задаче?
Он тупой
7B модели в Q4_K - вообще не вариант использовать. У них потери огромные из-за Q4_K
Меня больше удивляет проверка на фактах. Если модель не видела эти факты, что вы ожидаете? В задаче про банан - логика и внимание к деталям (тарелка на банане)
Фактов от неё как раз никто не ждёт, я выше об этом писал Одной задачей про банан вы ставите оценку качества модели? Посмотрите сколько итераций и сколько примеров используется в известных бенчмарках
Задача про банан, это просто забавная задача. Я никаких суждений на основе решения этой задачи через ллм не делаю.
Обсуждают сегодня