170 похожих чатов

Надо красиво разбить текст на предложения (в идеальном случае, чтобы какбы

вложенные предложения не разделялись от обемлющего)

пока так:
def to_sentences(text: str) -> list[str]:
sentences = re.findall(r"\s*([^.?!]*[!.?]*)", text)
return sentences
но проблема, что последним предложение в списке всегда идет пустая строка...
Как изменить регулярное выражение чтобы в конец списка не падала пустая строка?

15 ответов

17 просмотров
аndrei- Автор вопроса

лучше мне помогите

Примеры можно?

аndrei- Автор вопроса
Tishka17
Примеры можно?

"Привет! Меня зовут Алиса. Хочешь задать вопрос?" в это: ["Привет!", "Меня зовут Алиса.", "Хочешь задать вопрос?"] }

аndrei
"Привет! Меня зовут Алиса. Хочешь задать вопрос?" ...

>>> a='Beautiful, is; better*than\nugly' >>> import re >>> re.split('; |, |\*|\n',a) ['Beautiful', 'is', 'better', 'than', 'ugly']

А почему не re.split?

аndrei- Автор вопроса
Владимир
А почему не re.split?

наверное себе задачу не так поставил..., да и так контроль больший (но не в моем случае), прост в планах сдлеать чтобы не срабатывало на цитаты внутри определеных предложение, что-то типо такого чтобы вложиенность учитывало... если я правильно выразился

аndrei
наверное себе задачу не так поставил..., да и так ...

И цитаты... Гмм ну тут конечно регуляркой не отстреляешься)

аndrei- Автор вопроса
Tishka17
Тяжко будет

вложенность и не так важно, но в идеально случае, да, можно было бы кафануть от решения

sentences.pop(-1)

аndrei- Автор вопроса
addlyy
sentences.pop(-1)

я не хочу идти по этому пути...

аndrei
наверное себе задачу не так поставил..., да и так ...

сделай парсер простенький идёшь по символам, если цитата началась, ждёшь конца, если закончилось предложение, закидываешь в список

аndrei- Автор вопроса
аndrei
вложенность и не так важно, но в идеально случае, ...

Ну тогда ... Ухх... тебе надо начинать с поиска вложенных чтобы об них не споткнуться. И только потом дробить на предложения

аndrei- Автор вопроса
Владимир
Ну тогда ... Ухх... тебе надо начинать с поиска вл...

вложенность подождет) как сделать это \s*([^.?!]*[!.?]*) чтобы оно не генерило в конце пустую строку

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Я вот подумал. SSE выполняет операции максимум с 64-битной точностью. А FPU - всегда с 80-битной. Разве не должно быть FPU точнее тогда?
The Bird of Hermes
13
как быть с принтером? такой подход прокатит?
zamtmn
12
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Я не понимаю, это троллинг или что? Швабрика поддерживают, который буквально пишет на ассемблере взаимодействия с винапи. Я это ещё написал загрузчик и хоть что-то изучаю в о...
Shadow Akira
6
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Карта сайта