данных в столбце pandas пытаюсь использовать replace по словарю с регуляркой. С regex False замена не происходит, с regex True выдает ошибки, в связи с наличием спецзнаков в словаре.
Желательно их там и оставить; после предв. чистки пунктуации и спецзнаков эти знаки ни убрать совсем, ни заменить везде одинаково не получится без нарушения смысла. Там остаются ".", "/", "$", "%", "+" (первые 4 - из-за дробных значений в спецификациях, описаний дискаунтов и цен, а плюс в одних случаях меняется на пробел, но в других - должен стать plus, из-за названий множества разных моделей оборудования).
Как правильно и массово экранировать знаки в словаре? Нужно использовать re.escape?
Мои попытки это сделать не удались.
Не хотелось бы уменьшать и вычищать словарь, но уже близка к этому, лишь бы хоть alphanumeric куски сработали, которые без всяких знаков 🙈
Пробовала еще библиотеку flashtext (keywordprocessor и replace_keywords в цикле), она ругается так: "unsupported operand type(s) for +: 'float' and 'str'
Чтобы точно понять проблему нужен пример текста.
Спасибо, разобралась 😁 Полезно было записать проблему, чтобы перестать делать дичь. Экранировала с escape, и наконец-то правильно подала словарь в регулярку 😅 Надо делать перерывы, а то совсем уже, как хлебушек 🙈🍞
Обсуждают сегодня