Hello friends, I have a project that I used finetuning

at first, and then the vision transformer method for implementation. The accuracy obtained is 100%, but unfortunately it is slightly overfit. As far as I know, when finetuning is used In your opinion, apart from changing some parameters such as learning rate, train brach size, eval batch size and epoch, or using the grid search method, what can I do to improve the result?

3 ответов

29 просмотров

If you used a pre-trained model for fine-tuning, try using a different base model for transfer learning. Different architectures may have different generalization capabilities. If applicable, you may also use techniques like k-fold cross-validation to get a better estimate of your model's performance and reduce overfitting. Otherwise, you can use some of the regularization techniques like Dropout or L1/L2 Regularization. In case of Dropout, apply dropout layers to the model architecture. This randomly sets a fraction of input units to 0 during training, which can help prevent overfitting. For L1/L2 Regularization, you can add L1 or L2 regularization to the model's weights. This adds a penalty term to the loss function, which discourages the model from assigning too much importance to any one feature.

Arijit
If you used a pre-trained model for fine-tuning, t...

You can try each of these techniques and evaluate its impact on the overfitting issue. You can also use cross-validation to get a more robust estimate of your model's performance.

🦅Elham🦅- Автор вопроса
Arijit
You can try each of these techniques and evaluate ...

Thank you for answering my question🙏🏻 Model Transformer is a deep learning model used to process structured data such as linguistic and image data. This model is able to recognize complex patterns in the data and improve the performance of the model in different tasks by using transformer layers that include the main blocks of this model. On the other hand, transformer learning is a learning method that is used to train natural language processing models. In this method, the input data is considered as linguistic sentences, and by using transformer layers, the model automatically improves its performance in recognizing linguistic patterns from data without the need to define specific rules and algorithms. obtains In the field of machine vision, the Vision Transformer model is an example of a model transformer used for image processing. By using transformer layers, this model is able to recognize complex features in images and improve the performance of the model in various tasks.

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта