с 35-40 итерации loss начинает расти и к 60-й выдаёт полнейшую ерунду. Может кто-нибудь подсказать, что попробовать подкрутить, чтобы такого не было, или киньте ссылочку на годные материалы по LSTM?
Увеличить количество текста, уменьшить число нейронов, у меня неплохой результат получился для сети размером 768х768х768 с допаут 0.2 но корпус текстов был толстого Достоевского и ещё пару, размером почти 100 мегабайт
Обсуждают сегодня