170 похожих чатов

Добрый день, коллеги! Мне предложили использовать Наташу, чтобы из предложения

"Мне нравится, что по горизонтали углы обзора великолепные" извлекалась фраза "углы обзора великолепные", но не извлекалась "по горизонтали углы". Я построила синтаксическое дерево и что-то не могу понять, как это сделать. Хочется, чтобы из предложений извлекались только фразы, которые несут смысл, а не все подряд. Я взяла токены, из них все сгруппировала id по head_id. И получила
[['что', 'по', 'горизонтали', 'углы', 'обзора', 'великолепные'],
['по', 'горизонтали', 'углы', 'обзора'],
['углы', 'обзора']]
Но моих боевых фразах все еще хуже (относительного того, что мне нужно).
Или надо как-то иначе обрабатывать граф? Или я слишком много хочу и это так не работает?

5 ответов

16 просмотров

Возможно, глупость сморожу, но банальный tf-idf не пробовали натравить и поиграться с рангами?

оч сложная задача и пример. сам пытался в что-то подобное со stanza... но великий и могучий слишком могучий)

Irina-Dvoryaninova Автор вопроса

Нет, не пробовала. Надо подумать.

Irina Dvoryaninova
Нет, не пробовала. Надо подумать.

подумалось. Если в начале лемматизировать фразы, то можно отсечь предлоги, наречия и т.п., что бы не путались под ногами

Irina-Dvoryaninova Автор вопроса
Konstantin Galagan
подумалось. Если в начале лемматизировать фразы, т...

Я думала лемматизировать после построения синтаксического дерева. А если лемматизировать до, то разве Наташа сможет построить связи? Я не пробовала так делать, надо посмотреть. Спасибо за предложение.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта