169 похожих чатов

Ребята, посоветуйте, пожалуйста, как решить проблему. Для задачи чистки/унификации текстовых

данных в столбце pandas пытаюсь использовать replace по словарю с регуляркой. С regex False замена не происходит, с regex True выдает ошибки, в связи с наличием спецзнаков в словаре.

Желательно их там и оставить; после предв. чистки пунктуации и спецзнаков эти знаки ни убрать совсем, ни заменить везде одинаково не получится без нарушения смысла. Там остаются ".", "/", "$", "%", "+" (первые 4 - из-за дробных значений в спецификациях, описаний дискаунтов и цен, а плюс в одних случаях меняется на пробел, но в других - должен стать plus, из-за названий множества разных моделей оборудования).

Как правильно и массово экранировать знаки в словаре? Нужно использовать re.escape?
Мои попытки это сделать не удались.
Не хотелось бы уменьшать и вычищать словарь, но уже близка к этому, лишь бы хоть alphanumeric куски сработали, которые без всяких знаков 🙈

Пробовала еще библиотеку flashtext (keywordprocessor и replace_keywords в цикле), она ругается так: "unsupported operand type(s) for +: 'float' and 'str'

2 ответов

19 просмотров

Чтобы точно понять проблему нужен пример текста.

Daria- Автор вопроса

Спасибо, разобралась 😁 Полезно было записать проблему, чтобы перестать делать дичь. Экранировала с escape, и наконец-то правильно подала словарь в регулярку 😅 Надо делать перерывы, а то совсем уже, как хлебушек 🙈🍞

Похожие вопросы

Обсуждают сегодня

~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Ребят в СИ можно реализовать ООП?
Николай
25
народ, плиз хелп, всю голову сломал себе уже... разве может быть так, что GetProcAddress( GetModuleHandle( "kernel32.dll" ), "SetThreadDescription" ) вернёт ненулевое значение...
Iluha Companets
12
Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Коллеги, я тут для личных нужд пошел ставить MQTT сервер, пощупал mosquitto, но ужаснулся отсутствию такой банальности, как HTTP API для посмотреть список топиков. А тут что,...
Maksim Lapshin
14
#include <stdio.h> #include <stdlib.h> #include <time.h> void mass_first_generate(int mass[5][7]) {     for (int N = 0; N < 5; N++) {         for (int A = 0; A < 7; A++) {   ...
Чувак
6
Всем привет! Решаю 99 OCaml Problems и столкнулся со следующей проблемой (прошу палками не забивать, я OCaml практически не трогал до этого момента): open OUnit2 let create_...
К|/|pи/\/\ 6е3yглbIи
2
<?php function prepareTel($data, $modx, $_multiTV) { if ($data['iteration'] == $data['row']['total']) { $data['tel'] = '<a class="link" href="tel: ' . $data['tel']...
Кирилл Гацевич
2
а еще на 1.4.35 похоже не работает SMTP отправка, данные подключения указаны, а отправляет все равно через mail(), в том числе регистрацию, там ничего не ломали?
alexx GTX
6
Ну вот просто даже давайте вот как. Какой нибудь конкретный кейс, можете в пример привести, где бч работает и приносит прикладную пользу, а не просто что бы было? Не крипту.
Alexander Andreev
22
Карта сайта