170 похожих чатов

Привет! Подскажите пожалуйста, какие есть решения для качественной суммаризации больших

книг на русском? Хотелось бы на выходе сократить книгу в разы (в 3-4 раза, или больше), с минимальной потерей информации (сохранялись бы главные темы книги, не путались бы смыслы).
Сейчас делаем просто GPT-3.5 и результат нас устраивает по качеству, но жрёт много денег зараза. Хотелось бы по цене раза в 5-10 меньше вариант. Или вообще бесплатно.
Конечная цель - получения качественного описания книги, по сути суммаризация тут просто выступает этапам подготовки, чтоб текст полностью влез в окно GPT.
Собственно у меня есть следующие идеи:
1. Оставлять начало и конец книги, а в середине, допустим, выкидывать случайно 3 предложения из 4, или целыми абзацами.
2. Может стоит разбить текст на чанки и каким то подходом оценить информационную значимость каждого чанка и откинуть лишнего.
3. Может просто использовать какую то модель из открытого доступа для суммаризации русских текстов. Есть ли такие, качество которых сравнимо с качеством GPT-3.5?
Скорее всего я переизобретаю велосипед. Подскажите пожалуйста, в каком направлении лучше всего двигаться?

7 ответов

29 просмотров

Тоже интересно.

Можно попробовать несколько итераций, разбить на блоки, делать с Llama 13b orca с 8К контекстом (может и Мистраль 7B не плох будет). с 70B качество выше, но труднее, сильно дороже будет и дольше. Как мне кажется дешево и качественно, только GPT3.5-turbo c 16k контекстом может.

C GPT3.5 прогнозируемое качество, с остальными моделями - нужна подробная возня и тестирование.

Призрачный-Человек Автор вопроса
miteigi nemoto
Можно попробовать несколько итераций, разбить на б...

Мы сейчас делаем с 4к контекстом и всё равно дорого( С другими моделями действительно сложно, разворачивать, тестировать. Вот я думаю, может как-то можно сократить сами книги? Пропускать слова, абзацы. Сделать какую-то оценку, что кусок текста пустой по смыслу и его можно не обрабатывать

Claude 1/2 пробовали? там контекстное окно выше

Призрачный-Человек Автор вопроса
Max Azatian
Claude 1/2 пробовали? там контекстное окно выше

так дело же не в размере контекста, а в цене

Раньше была программа TextAnalyst с функцией реферата http://www.analyst.ru/index.php?lang=rus&dir=content/downloads/ Современных, аналогичных разработок не видел.

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
как быть с принтером? такой подход прокатит?
zamtmn
12
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Карта сайта