С чего начать изучение темы? Выбрала тему диплома: создание веб-сервиса для проверки текста на соответствие правил русского языка (тему выбрала сама, легких путей не ищу). Нашла, конечно, открытое АПИ одного сервиса, но хочется попробовать написать систему анализа самой. А опыта — ноль. С чего начать вообще не знаю, потому что всю жизнь занимаюсь тем, что пишу про стартапы и бизнес.
Привет, посмотри вот тут, может найдёшь что полезного: https://github.com/demidovakatya/vvedenie-mashinnoe-obuchenie
Если хочется похайпить на нейросеточках, то я бы предложил: 1. Намайнить заведомо-грамотные тексты. 2. Сделать искусственную выборку, в которой текст портится какими-нибудь легкопрограммируемыми методами (опечатки, лишняя/убранная пунктуация). 3. Обучить, например, transformer, который будет по испорченному тексту "восстанавливать" неиспорченный. 4. Обучить классификатор, который будет для каждой конкретной ошибки предсказывать её тип (тут можно синтетически сгенерировать выборку с различными типами ошибок). Но это всё долго и нетривиально.
Может поможет. https://nlpub.ru/%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0
Обсуждают сегодня