ни разу не запускал эти модели и кажется что-то упускаю.
тестировал на задачи саммаризации текста
Я запускал с файнтюнингом на qa Т5 в попытках извлечь оттуда что-то высокоэнтропийное
Суммаризация mT5 норм после плотного дообучения. Работает в проде. Сейчас пытаемся её научить делать коррекцию ошибок. Иногда прям в точку попадает, иногда "горе от ума" как говорится.
Обсуждают сегодня