170 похожих чатов

Добрый день, коллеги! Мне предложили использовать Наташу, чтобы из предложения

"Мне нравится, что по горизонтали углы обзора великолепные" извлекалась фраза "углы обзора великолепные", но не извлекалась "по горизонтали углы". Я построила синтаксическое дерево и что-то не могу понять, как это сделать. Хочется, чтобы из предложений извлекались только фразы, которые несут смысл, а не все подряд. Я взяла токены, из них все сгруппировала id по head_id. И получила
[['что', 'по', 'горизонтали', 'углы', 'обзора', 'великолепные'],
['по', 'горизонтали', 'углы', 'обзора'],
['углы', 'обзора']]
Но моих боевых фразах все еще хуже (относительного того, что мне нужно).
Или надо как-то иначе обрабатывать граф? Или я слишком много хочу и это так не работает?

5 ответов

11 просмотров

Возможно, глупость сморожу, но банальный tf-idf не пробовали натравить и поиграться с рангами?

оч сложная задача и пример. сам пытался в что-то подобное со stanza... но великий и могучий слишком могучий)

Irina-Dvoryaninova Автор вопроса

Нет, не пробовала. Надо подумать.

Irina Dvoryaninova
Нет, не пробовала. Надо подумать.

подумалось. Если в начале лемматизировать фразы, то можно отсечь предлоги, наречия и т.п., что бы не путались под ногами

Irina-Dvoryaninova Автор вопроса
Konstantin Galagan
подумалось. Если в начале лемматизировать фразы, т...

Я думала лемматизировать после построения синтаксического дерева. А если лемматизировать до, то разве Наташа сможет построить связи? Я не пробовала так делать, надо посмотреть. Спасибо за предложение.

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Коллеги, как получить PId для собственного процесса из под линукса?
Роман Лях (rgreat)
6
@ahndmn @ayaw0_0 здарова, на чем пишете?
Aiwan \ (•◡•) / _bot
7
Карта сайта