169 похожих чатов

Ребята, посоветуйте, пожалуйста, как решить проблему. Для задачи чистки/унификации текстовых

данных в столбце pandas пытаюсь использовать replace по словарю с регуляркой. С regex False замена не происходит, с regex True выдает ошибки, в связи с наличием спецзнаков в словаре.

Желательно их там и оставить; после предв. чистки пунктуации и спецзнаков эти знаки ни убрать совсем, ни заменить везде одинаково не получится без нарушения смысла. Там остаются ".", "/", "$", "%", "+" (первые 4 - из-за дробных значений в спецификациях, описаний дискаунтов и цен, а плюс в одних случаях меняется на пробел, но в других - должен стать plus, из-за названий множества разных моделей оборудования).

Как правильно и массово экранировать знаки в словаре? Нужно использовать re.escape?
Мои попытки это сделать не удались.
Не хотелось бы уменьшать и вычищать словарь, но уже близка к этому, лишь бы хоть alphanumeric куски сработали, которые без всяких знаков 🙈

Пробовала еще библиотеку flashtext (keywordprocessor и replace_keywords в цикле), она ругается так: "unsupported operand type(s) for +: 'float' and 'str'

2 ответов

39 просмотров

Чтобы точно понять проблему нужен пример текста.

Daria- Автор вопроса

Спасибо, разобралась 😁 Полезно было записать проблему, чтобы перестать делать дичь. Экранировала с escape, и наконец-то правильно подала словарь в регулярку 😅 Надо делать перерывы, а то совсем уже, как хлебушек 🙈🍞

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта