Hello friends, I have a project that I used finetuning

at first, and then the vision transformer method for implementation. The accuracy obtained is 100%, but unfortunately it is slightly overfit. As far as I know, when finetuning is used In your opinion, apart from changing some parameters such as learning rate, train brach size, eval batch size and epoch, or using the grid search method, what can I do to improve the result?

3 ответов

12 просмотров

If you used a pre-trained model for fine-tuning, try using a different base model for transfer learning. Different architectures may have different generalization capabilities. If applicable, you may also use techniques like k-fold cross-validation to get a better estimate of your model's performance and reduce overfitting. Otherwise, you can use some of the regularization techniques like Dropout or L1/L2 Regularization. In case of Dropout, apply dropout layers to the model architecture. This randomly sets a fraction of input units to 0 during training, which can help prevent overfitting. For L1/L2 Regularization, you can add L1 or L2 regularization to the model's weights. This adds a penalty term to the loss function, which discourages the model from assigning too much importance to any one feature.

Arijit
If you used a pre-trained model for fine-tuning, t...

You can try each of these techniques and evaluate its impact on the overfitting issue. You can also use cross-validation to get a more robust estimate of your model's performance.

🦅Elham🦅- Автор вопроса
Arijit
You can try each of these techniques and evaluate ...

Thank you for answering my question🙏🏻 Model Transformer is a deep learning model used to process structured data such as linguistic and image data. This model is able to recognize complex patterns in the data and improve the performance of the model in different tasks by using transformer layers that include the main blocks of this model. On the other hand, transformer learning is a learning method that is used to train natural language processing models. In this method, the input data is considered as linguistic sentences, and by using transformer layers, the model automatically improves its performance in recognizing linguistic patterns from data without the need to define specific rules and algorithms. obtains In the field of machine vision, the Vision Transformer model is an example of a model transformer used for image processing. By using transformer layers, this model is able to recognize complex features in images and improve the performance of the model in various tasks.

Похожие вопросы

Обсуждают сегодня

Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Всем привет! поделитесь, пож-та, как кто дебажил / решал проблему с 504 Time out ошибкой от nginx, когда стучишься на свой vapor сервер? в логах /var/log/nginx/error.log е...
Paul
24
Это фейк @cruppto_newbot?
Antskup
13
Может кто подсказать какие требования к изображениям для обучения Yolo v8? Как то разрешение, размер выделяемого обьекта в пикселях, оптимальное кол-во изображений. А то я пыт...
Владислав😎
16
Кто-нибудь знает, как считается нагрузка на цпу? И что такое вообще "нагрузка на цпу"? вот, например, есть у цпу какой-то clock, настроенный на 3 ГГц --- Что значит "нагрузка...
Toideng
15
Я тут пытаюсь переработать архитектуру подсистемы памяти ядра во что-то осмысленное. Есть pmm, который создает набор range’ей(пока что только для ядра, потом для юзерспейса), ...
Evg Resh
19
ребят, привет. за какое время бот полученную заявку на вступление в группу может принять \отклонить? Помню речь была про 5 минут, сейчас как?
Роман Ромашин :)
10
Гуру lldb имеются?) Пробую себя в дебаге и реверсе на примере функции _CFProcessPath. Ставлю брейкпоинт по названию, и выполнение программы на ней приостанавливается. Дальше ...
Сергей Романенко
1
Доброго времени суток. Правильно ли я понимаю, что с введением новой платежной единицы stars, я просто могу оставить текущую платёжку от Юкассы, которая выполняется на сайте с...
Prokhor Chulkov
7
Карта сайта