169 похожих чатов

Ребята, посоветуйте, пожалуйста, как решить проблему. Для задачи чистки/унификации текстовых

данных в столбце pandas пытаюсь использовать replace по словарю с регуляркой. С regex False замена не происходит, с regex True выдает ошибки, в связи с наличием спецзнаков в словаре.

Желательно их там и оставить; после предв. чистки пунктуации и спецзнаков эти знаки ни убрать совсем, ни заменить везде одинаково не получится без нарушения смысла. Там остаются ".", "/", "$", "%", "+" (первые 4 - из-за дробных значений в спецификациях, описаний дискаунтов и цен, а плюс в одних случаях меняется на пробел, но в других - должен стать plus, из-за названий множества разных моделей оборудования).

Как правильно и массово экранировать знаки в словаре? Нужно использовать re.escape?
Мои попытки это сделать не удались.
Не хотелось бы уменьшать и вычищать словарь, но уже близка к этому, лишь бы хоть alphanumeric куски сработали, которые без всяких знаков 🙈

Пробовала еще библиотеку flashtext (keywordprocessor и replace_keywords в цикле), она ругается так: "unsupported operand type(s) for +: 'float' and 'str'

2 ответов

9 просмотров

Чтобы точно понять проблему нужен пример текста.

Daria- Автор вопроса

Спасибо, разобралась 😁 Полезно было записать проблему, чтобы перестать делать дичь. Экранировала с escape, и наконец-то правильно подала словарь в регулярку 😅 Надо делать перерывы, а то совсем уже, как хлебушек 🙈🍞

Похожие вопросы

Обсуждают сегодня

$params = [ 'formid' => 'feedbackForm', 'formTpl' => '@CODE: <form class="form-validate" data-id="ajax_form"> <fieldset class="margin-bottom-md"> ...
Pathologic
1
И ещё вопрос: можно ли типа как на дос как-то запариться и с помощью прерываний выводить текст, вместо функции printf ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
34
окей, дело реально в org было. но что за мусор в конце?
Vi Chapmann
15
Ладно, ещё тупого спрошу. Код должен банально вывести значение регистра на консоль, на деле же не выводя ничего, просто оставляя нерабочую консоль (открыта, ничего не написан...
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
25
Есть тут крутые SQL-маньяки (в частности postgresql)? Нужна помощь, совет, что-то всю голову сломал, не могу придумать как реализовать нужное. Есть вот такой набор данных: f...
Alex
11
здравствуйте. пытаюсь проверить, содержится ли в десятичном представлении инта некоторая цифра. совершаю: strstr(x, "5") != NULL) получаю ошибку с фото (заведомо неработающий ...
Катя Шевчук🪇
18
Что там вообще с кроссплатформенностью?
🄼🄰🄺🅉🄰🄸
23
Ребят, а вот такой вопрос: если я владелец бота анонимного чата, в котором, например, имеются подписки, используя какую-нибудь ЮКассу (или тому подобное, в общем с налогами, в...
Eugene Неелов
8
Доброй ночи. Вопрос знатокам. Имеется некая таблица, результат которой выведен в DBGrid на форме. И есть форма, с помощью которой можно как добавить запись, так и отредактиров...
Евгений
28
а всё почему? потому что ассемблер в отличии от яву порождает множество пагубных привычек, среди которых например можно отметить использование глобальных переменных для всего ...
Mixail Frolov
35
Карта сайта