169 похожих чатов

Dear team, I'm working on a project in which i

have an imbalance dataset,
To train a model i did the train test split based on y, did the stratified cross validation for model on train dataset, did the hyperparameter tuning. Now i have finalized model with tuned hyperparameter

To build final model, i'll have to train finalzed model with tuned hyperparameter on full data set which is original train + test.

Now my question is how should i give data to the model.
Do i have to provide original dataset which is imbalanced? or do i have to give balanced original dataset?

3 ответов

40 просмотров

In my opinion, there is no yes/no kind of answer. If you’ve done stratified train/test split based on the feature you are trying to predict, then the final model where train+test is used as train would be imbalanced by setup. If you’ve employed over/under sampling techniques up front, then this is where you’ve done some balancing and thus I doubt the model would generalize that well

You give the data you used for hyperparameter tuning. Otherwise, you are giving another data, as this will be modified (balaned)

Lokesh- Автор вопроса

Yes, thank you. I have been thinking the same thing that i should use same data. Otherwise what is the point of doing hyperparameter tuning and cross validation. Any idea how can i see how much final model performance is deviated from cross validation score?

Похожие вопросы

Обсуждают сегодня

Ну вот просто даже давайте вот как. Какой нибудь конкретный кейс, можете в пример привести, где бч работает и приносит прикладную пользу, а не просто что бы было? Не крипту.
Alexander Andreev
22
Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
объясните пожалуйста, почему функция не работает должным образом? вроде должно брать активное окно сравнивать его размер с размером экрана, и если есть совпадение = true прове...
JF
9
> Копаем глубже > Следующий момент был, когда я спросил его, знает ли он JavaScript. Он ответил, что его учили работать с C#. Я тоже в университете писал на C#, но даже там мн...
Oleg Volkov
4
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
7
Всем привет! вывожу на общей стр дочерние ресурсыв каждом ресурсе галерея, и первая фотка должна выводиться на общей [!DocLister? &prepare=photo !]
Alekso
12
Карта сайта