Нашёл инфу про rubert toxic, но мб есть что-то получше?
2) есть ли модели, которые могут выделять различные оскорбления и маты в текстах? С учётом того, что люди могут что-то новые придумывать, цензурить, менять символы и прочее
Для русского языка
https://arxiv.org/pdf/2105.09052.pdf https://www.dialog-21.ru/media/5366/dementyevaplusetal.pdf
Я кое-что делал в рамках последней диалоговской дорожки по детоксификации. Детектор: https://huggingface.co/IlyaGusev/rubertconv_toxic_clf Теггер, который подсвечивает "плохие" слова: https://huggingface.co/IlyaGusev/rubertconv_toxic_editor Статья на рецензировании, сейчас на arxiv выложу
Обсуждают сегодня