токсичного общения.
Смотрел в сторону https://github.com/vearutop/php-obscene-censor-rus
Неплохо, но нужно дополнительно накрутить проверки.
Пробовал в отдельном контейнере http сервер llama.cpp поднимать и туда модели подсовывать, но эффект слишком уже медленный + профит не лучше чем предыдущем варианте.
Взял словарь https://github.com/nickname76/russian-swears и натравил его на классификатор через тот же пакет https://github.com/jorgecasas/php-ml
Скорость выше. Результат - ну может чуточку точнее. Не более.
Вопрос - у кого опыт был решения подобных задач именно в рамках экосферы пыхи?
Пробовал, но сдался, всё равно юзеры обойдут. Из последних мыслей было взять https://github.com/cijic/phpmorphy и каждый коммент прогонять по десятку известных матов, которые запрещёнка. Но не пробовал. Вроде он должен бы с морфологией найти)
Обсуждают сегодня