Надо красиво разбить текст на предложения (в идеальном случае, чтобы какбы

Question

Надо красиво разбить текст на предложения (в идеальном случае, чтобы какбы

вложенные предложения не разделялись от обемлющего)

пока так:
def to_sentences(text: str) -> list[str]:
sentences = re.findall(r"\s*([^.?!]*[!.?]*)", text)
return sentences
но проблема, что последним предложение в списке всегда идет пустая строка...
Как изменить регулярное выражение чтобы в конец списка не падала пустая строка?

#backend #programming #python #russian

0

02.02.2022

15 ответов

41 просмотр

аndrei Автор вопроса

лучше мне помогите

0

02.02.2022

аndrei Автор вопроса

Tishka17
Примеры можно?

"Привет! Меня зовут Алиса. Хочешь задать вопрос?" в это: ["Привет!", "Меня зовут Алиса.", "Хочешь задать вопрос?"] }

0

02.02.2022

addlyy

аndrei
"Привет! Меня зовут Алиса. Хочешь задать вопрос?" ...

>>> a='Beautiful, is; better*than\nugly' >>> import re >>> re.split('; |, |\*|\n',a) ['Beautiful', 'is', 'better', 'than', 'ugly']

0

02.02.2022

Владимир

А почему не re.split?

0

02.02.2022

аndrei Автор вопроса

Владимир
А почему не re.split?

наверное себе задачу не так поставил..., да и так контроль больший (но не в моем случае), прост в планах сдлеать чтобы не срабатывало на цитаты внутри определеных предложение, что-то типо такого чтобы вложиенность учитывало... если я правильно выразился

0

02.02.2022

Tishka17

аndrei
наверное себе задачу не так поставил..., да и так ...

Тяжко будет

0

02.02.2022

Владимир

аndrei
наверное себе задачу не так поставил..., да и так ...

И цитаты... Гмм ну тут конечно регуляркой не отстреляешься)

0

02.02.2022