Доброго вечера. Такая проблема. Есть некая переменная (не временная серия)

Alexey Ivanov
Результаты на каком наборе данных посчитаны: трени...

Результаты на каком наборе данных посчитаны: тренировочный, тестовый? Если на тренировочном то есть риск оверфита, если на тестовом то это получается не совсем «тестовый», потому что вы его уже на выбор модели «потратили». Для выбора модели лучше что-то другое использовать, типа кросс-валидации, или отдельный набор данных

0

20.08.2023

Serg Gini

А чем плохо потратить на тестовом наборе?

0

20.08.2023

Serg Gini
А чем плохо потратить на тестовом наборе?

Тем что это теперь не тестовый в каноническом виде, так как данные использовались для выбора модели. На «настоящем» тестовом качество предсказания может оказаться похуже. Но это конечно меньший грех чем считать на тренировочном.

0

20.08.2023

Serg Gini

Alexey Ivanov
Тем что это теперь не тестовый в каноническом виде...

Что такое настоящий тестовый набор? Типа на другом тестовом результаты могли бы выбрать другую модель? Тут уже вопрос репрезентативности выборки и других характеристик распределения данных

0

20.08.2023

Serg Gini
Что такое настоящий тестовый набор? Типа на другом...

В моём понимании тестовый набор данных это набор данных который используется на самом последнем этапе для честной оценки качества модели, после этого этапа никакие подкрутки модели (в том числе выбор параметров или архитектуры) уже недопустимы

0

20.08.2023

Serg Gini

Alexey Ivanov
В моём понимании тестовый набор данных это набор д...

Мы это называем валидационный)

0

20.08.2023

Serg Gini
Мы это называем валидационный)

Не буду спорить, так как на это есть различные мнения https://stats.stackexchange.com/questions/525697/why-is-it-that-my-colleagues-and-i-learned-opposite-definitions-for-test-and-val

0

20.08.2023

Ilya Shutov
Правильно я понимаю, что истинная функция неизвест...

Правильно я понимаю, что истинная функция неизвестна в принципе и просто какие-то N случайных датасетов, найденных «на улице»? Вопрос: можно ли оценить их схожесть с неизвестным эталоном? Я бы сказал что невозможно. Нельзя ответить на вопрос, который даже не сформулирован. Пример: есть 7 ответов от моделей, в какой день празднуют Новый год. Ответы от пн до вс. Какой верный?

0

21.08.2023

I L Автор вопроса

Почти. Истинная функция не известна -- это да. Но с датасетами там сложнее. Просто посчитаны модели в сторонней програме (не мной), и вывалили в файл.

0

21.08.2023

Ilya Shutov
Раньше обычно на сцене появлялся экспат, тыкал пал...

Раньше обычно на сцене появлялся экспат, тыкал пальцем и говорил «зуб даю, я ее узнал» и получал бонус. Но теперь правила игры поменялись.

0

21.08.2023

I L Автор вопроса

Ну так я за зубом прийти могу)) Поэтому не появляются.

0

21.08.2023

I L
Почти. Истинная функция не известна -- это да. Но ...

Модели «доллар по 200»? Если метрик обучения нет — ну посчитайте отклонения от исходных данных, если есть такие точки, и ткните пальцем. Эффект примерно такой же, «мнк линейкой на глаз». Кому не понравится — пусть свою методу дает. Самое время место достать из ящика шар принятия решений.

0

21.08.2023

I L Автор вопроса

Ilya Shutov
Модели «доллар по 200»? Если метрик обучения нет...

Нет, с моделями доллар по 200 всё проще. Нет. Варианты расчёта для принятия решения. Так понимаю факторы одни, только разница где берут и за какое время.

0

21.08.2023

I L
Нет, с моделями доллар по 200 всё проще. Нет. Вари...

Ну хорошо, проведем мысленный эксперимент. Снимем крышку с ящика моделей. А там видим вот что: Бородатые дядьки саентологи сидят в пабе, пьют пиво, кидают дартс и записывают результаты в качестве предикта. В конце обертывают ленточкой и отдают Вам, а полученные деньги передают бармену. Что-то меняется в ощущениях исходного вопроса?

0

21.08.2023

I L Автор вопроса

Ilya Shutov
Ну хорошо, проведем мысленный эксперимент. Снимем...

Хм. Хотел написать - Не меняется. Вроде на эти грабли давно не наступал. Похоже наступил. Буду думать.

0

21.08.2023

I L
Хм. Хотел написать - Не меняется. Вроде на эти гра...

Я просто выступил оппонентом по исходному тексту. Устойчивая конструкция не должна рухнуть от легкого касания.

0

21.08.2023

I L Автор вопроса

Ilya Shutov
Я просто выступил оппонентом по исходному тексту. ...

Это отличные вопросы. В том то и дело, не уверен что конструкция рухнула, по крайней мере вижу пути по её упрочнению.

0

21.08.2023

I L Автор вопроса

Ilya Shutov
Я просто выступил оппонентом по исходному тексту. ...

Как всегда, взгляд со стороны помог. Особенно если это взгляд опытного человека.

0

21.08.2023

I L
Это отличные вопросы. В том то и дело, не уверен ч...

Я на выходных тоже немного с бетоном возился.

0

21.08.2023

I L Автор вопроса

Ilya Shutov
Я на выходных тоже немного с бетоном возился.

Кто написал -- не помню. Любая история - это одна и таже история.

0

21.08.2023

Ilya Shutov
Модели «доллар по 200»? Если метрик обучения нет...

Трасса 60)

0

21.08.2023

Ilya Shutov
Я на выходных тоже немного с бетоном возился.

Дискретка? Или бетон строительный?)

0

21.08.2023

I L
Кто написал -- не помню. Любая история - это одна ...

Вы уверены что формулировка звучит именно так?

0

21.08.2023

@quadrivium
Дискретка? Или бетон строительный?)

0

21.08.2023

А чего Арматура не связана?)) и ячейки слишком мелковаты, как для обычного строительства. Будто бункер льёте ?)

0

21.08.2023

@quadrivium
А чего Арматура не связана?)) и ячейки слишком мел...

хороший вопрос! ждал подобного. потому что картинка не моя, а демонстрационная :) https://beton-trans.ru/catalog/beton/beton-v-12-5-m-150/

0

21.08.2023

I L Автор вопроса

@quadrivium
Вы уверены что формулировка звучит именно так?

))) Строго говоря здесь две формулировки. В первой абсолютно уверен, не помню кто автор изречения. Во второй, настолько насколько можно быть уверенным в своей памяти.

0

21.08.2023

Philipp Upravitelev

I L
Кто написал -- не помню. Любая история - это одна ...

это вольный пересказ "четырех историй" Борхеса

0

21.08.2023

@quadrivium · Accepted Answer