(типа размер там)
Я делал две вещи: 1) добавление слоя к очень маленькой модели, чтобы улучшить её capacity 2) удаление некоторых слоёв в большой модели, чтобы уменьшить её ресурсоёмкость Обе работали.
большой это порядка 7b+?
нет, в моём случае
Обсуждают сегодня