Может теперь Claude2 при случае как-то замерить или дать советы

3 недели назад https://t.me/llm_under_hood/54 code были: gpt-4 100, claude-v1 92. Сейчас 78 и 42. Непонятно что этот бенчмарк измеряет, и почему меняется.

0

12.07.2023

Leonid Y Автор вопроса

Yuriy Nazarov
3 недели назад https://t.me/llm_under_hood/54 code...

модели в сервисах, к слову, тоже обновляются, не всегда в лучшую сторону

0

12.07.2023

Rinat Abdullin

Leonid Y
модели в сервисах, к слову, тоже обновляются, не в...

За claude-v2 обидно, да. Ну и за улучшение GPT-4 в области кода, в ущерб другим областям.

0

12.07.2023

Barefoot Gen

Yuriy Nazarov
3 недели назад https://t.me/llm_under_hood/54 code...

Да, очень интересно что меняют обновления. Разве они проводят дообучение, база данных исключений мб просто?

0

12.07.2023

Leonid Y Автор вопроса

Barefoot Gen
Да, очень интересно что меняют обновления. Разве о...

проводят. там где-то даже приписка есть о номере версии. мелким шрифтом

0

12.07.2023

vvv · Accepted Answer

vvv

https://t.me/llm_driven_products/1975

0

12.07.2023

170 похожих чатов

Может теперь Claude2 при случае как-то замерить или дать советы

8 ответов

Похожие вопросы