что для суммаризации текста обязательно расставить знаки препинания. То есть если у меня есть аудио, которое я перевел в текст, где просто подряд идут слова, такой текст же не годится для суммаризации?
Влияет но не сильно, знаки препинания могут помочь разделить фразы и предложения, которые могут смешаться без них. Опять же, все от задачи и деталей зависит. Для YouTube на Chromе есть free плагин на базе ChatGpt -он переводит/транскрибирует и суммаризирует смысл видео очень неплохо: вы можете сравнить результаты со своими либо свои аудио загрузить и суммаризировать. Либо использовать напрямую свой текст через gpt и посмотреть ломается логика или нет.
Хм.Просто мне казалось, что очень сильно, поскольку я пробовал сначала сделать преобразование аудио на русском языке в текст. Вышло неплохо. А дальше я пробовал засунуть этот текст в медиум барт и там суммаризация вообще не о том. Условно в тексте фигурирует какая-то фамилия, модель цепляется за нее и уходит вообще в другую степь.
Если просто сплошной текст вообще без пунктуации, мне кажется, там не будет смысла особого. Обычно транскрибация, типа whisper, более менее расставляет точки, и иногда запятые. Я подумал речь о таком тексте.
Ну whisper я просто не нашел на русском языке.
Если у вас мак-есть macwhisper, приложение
Я, наверное, что-то не так понял, но wer у whisper больше, чем у конформера?
Я недавно делал суммаризацию для вводного видео про chat GPT. Час лень было слушать заново. Просто прогнал через транскрайбер, а потом весь этот поток слов скормил ChatGPT. Он разобрался с первого раза.
Сложно сказать, они разные, мне кажется они могут иметь разные результаты на разных наборах
А в качестве транскрайбера что использовал?
Первый попавшийся, который в MS Teams встроен.
Обсуждают сегодня