170 похожих чатов

Всем привет! Посоветуйте, пожалуйста, как лучше сделать саммари отзывов на

товары? Текстов много, больше чем на 8К токенов и они между собой не связаны.
- Пробовала ru-bart, много повторов получается (из серии арбуз очень сладкий, сладкий) и противоречий (сладкий, но немного кислый)
- Пробовала saiga (но у меня только V100 (оч странные результаты, ну как в карточке и написано), а в T4 в колабе не влезает),
- пробовала llama2-13b-orca-8k-3319 - результат получше, но тоже не влезает все в контекстное окно, делала саммари по частям по 8к и потом саммари над несколькими саммари
- про llamaindex читала, но не нашла реализации именно для саммари, все больше поиск по многостраничным документам
TLDR: Подскажите, пожалуйста, как лучше сделать саммари 300-400 отзывов и как такое впихивать в контекстное окно в 8к

6 ответов

19 просмотров

попробуйте langchain c map_reduce саммари, правда я для отзывов не знаю как сработает, суть в том, что сначала по каждому тексту делается свое саммари, а потом объединяется в общее

Daria-Mishina Автор вопроса

В таком случае может лучше кластеризацию? Нарисовать большой рисунок кластеров и будет наглядно видно какие группы отзывов. Саммари просто в конце концов может свести к одному предложению: или в среднем хорошо или в среднем плохо в зависимости от того, каких больше положительных или отрицательных. Моя гипотеза

Daria-Mishina Автор вопроса
Erdeni
В таком случае может лучше кластеризацию? Нарисова...

У меня для каждого отзыва оценки есть) то есть уже понятно, хорошо или плохо. Задача понять что именно плохо или хорошо. Ключевые слова и нграммы считаю уже, но и саммари нужно

Daria Mishina
У меня для каждого отзыва оценки есть) то есть уже...

Может саммари по кластерам, а потом их конкатенировать, вместо саммари?) это так просто гипотеза

Daria-Mishina Автор вопроса
Erdeni
Может саммари по кластерам, а потом их конкатениро...

Там даже по каждому классу( ну то есть по оценкам от 1 до 5) получается по 300 отзывов и саммари просто в лоб (как я писала) не оч хорошее

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта