можете не писать any(x in string for x in stop_words). Гляньте видео
Как же много в 2к20-м "видео-блоггеров" развелось)
Добавь в стоп-слова "Флюгегехаймен")
розоброть ойфон
Все ж просто: if [x in name.split(" ") for x in stop_words]: # Делаешь что-то
Почему?)
Ты может его протестируешь?
видео не смотрел, потому что 1. делать больше нечего, и 2. всегда можно сформулировать текстом, было бы желание. if len(set(stop_words) & set(name.split())): …
Language: Python Source: stop_words = ["Флюгегехаймен", "Стоп", "розбор"] name = "Флюгегехаймен айфон продам розбор" if [x in name.split(" ") for x in stop_words]: print(True) Result: True Note: python3 assumed, other valid option is python2, you can be more specific next time.
Это тупое решение, но оно работает)
предлагаю тебе не помогать
Как фильтровать строку по стоп-словам из списка? Если сделать any(x in string for x in stop_words), то вот в таком кейсе вычисление будет неправильно: stop_words = ["6"] string = "Продам iphone 5 64GB” Да, можно сделать any(x in string.split(" ") for x in stop_words), но тогда в следующем случае тоже будет неправильно детектится: stop_words = ["на разборку”] string = "Продам iphone Xs на разборку”
def check_stop_words(name, stop_words): for x in stop_words: if x in name: return True return False stop_words = ["Флюгегехаймен", "Стоп", "розбор"] name = "Ф125125 Танк Т-34 продам розбор" print(check_stop_words(name, stop_words))
Получается так проверяет отличным методом от any() ?
Нет, все равно неправильно же
Тогда if x in name.split(" ") на 47-ой строке
regex можно попробовать: re.search(r"\b(?:6|на разборку)\b", text)
На 43. Я описал почему оно не работает
есть ли границы количества слов в стоп словах?
Может быть одно, а может и два. Но в идеале проработать чтобы было без разницы 2 стоп-слова или больше
Я додумался все таки. За целый день не смог. В итоге решил на следующий. Stremove просто string.replace(char, char) в цикле, не обращайте внимания.
старайся всегда избегать дублирования кода, в питоне это очень плохая практика
тут можно твое огромное выражение от х до lower вынести в отдельную переменную перед ифами, а проверку на in-stops лучше делать после ифов, ибо она выполнится в любом случае, незавмсимо от них
да, и еще, чтоб не разбивать строку на огромный список, в котором может быть миллилгы слов лучше использовать x.split('', 1), она разбивает слова только по 1 пробелу, что больше, чем достаточно
Очень сложно понять. Что оно должно делать?
он же кидал
def _has_stop_word(phrase, stop_word): if " " in stop_word: return stop_word in phrase else: return stop_word in pharse.split(" ") def has_stop_words(phrase, stop_words): phrase = stremove(phrase, "!,.").lower() return any(_has_stop_word(phrase, w) for w in stop_words)
Работает, да. Но логику не понял(
И зачем две функции?
Зачем вот return stop_word in phrase
Возвращает бул, если есть вхождение
Ты в своем коде убрал бы else?
Почему?
Это не early return с проверками, а разные логические ветки
Да, кстати, попробовал оправдать твоё "нет" у себя в голове и тоже так подумал
Обсуждают сегодня