документах? Т.е один из текстов размера научной статьи(не всегда влезающей в контекстное окно llm), другой - короткое предложение.
А именно в случае с научными статьями для задачи не хватит представить статью аннотацией или конкретным разделом, который уже в контекст влезет?
Аннотацией не советую, у многих статей абстракты слабо отражают суть и ценность статьи, хотя это от области знаний зависит, конечно
Речь идёт именно про поиск каких-то второстепенных вещей в статье. Поэтому аннотации точно не хватит. Регулярка для представления того, где могут эти вещи быть и потом llm - это единственный подход или есть еще?
Обсуждают сегодня