датасете обучить модель поменьше, можно ли будет коммерчески использовать получившуюся модель?
По факту это дистилляция, видел статью, где из gpt3 делали RoBERTa, которая показала практически такой же результат
Нет нельзя
Обсуждают сегодня