169 похожих чатов

Доброго вечера. Такая проблема. Есть некая переменная (не временная серия)

и десятка полтора результатов моделирования этой переменной. При этом сами модели - черный ящик, посчитано на стороне. Нужно выбрать лучшую, доказать что она лучшая и показать разницу.
Руками то посчитал и Пирсона и R2, остатки проверил ну и вроде всё что нужно.
Но при этом заинтересовал вопрос есть ли какой-нибудь пакет, который всё это делает. По факту это конечно base, мало что за его пределами, но в одном месте может собрано? Повторю, самих моделей нет, только результаты и исходные данные.

33 ответов

74 просмотра

Машинное обучение тогда, раз моделей несколько, тогда методом перебора искать лучшую комбинацию причинно-следственной связи

R2 и Пирсон - это есть одно и тоже. Ее не рекомендуют использовать. Попробуйте пакет , там есть много других метрик типа mse, made, mae etc

Не совсем понятно, какова итоговая цель. Автоматизировать процесс сравнения? Если так, можно написать скрипт, таким образом, что бы расчеты повторялись, независимо от исходных данных (2 модели на вход или 22) Можно написать свою функцию и вызывать ее (подключать или через box)

I-L Автор вопроса

Результаты на каком наборе данных посчитаны: тренировочный, тестовый? Если на тренировочном то есть риск оверфита, если на тестовом то это получается не совсем «тестовый», потому что вы его уже на выбор модели «потратили». Для выбора модели лучше что-то другое использовать, типа кросс-валидации, или отдельный набор данных

Alexey Ivanov
Результаты на каком наборе данных посчитаны: трени...

А чем плохо потратить на тестовом наборе?

Serg Gini
А чем плохо потратить на тестовом наборе?

Тем что это теперь не тестовый в каноническом виде, так как данные использовались для выбора модели. На «настоящем» тестовом качество предсказания может оказаться похуже. Но это конечно меньший грех чем считать на тренировочном.

Alexey Ivanov
Тем что это теперь не тестовый в каноническом виде...

Что такое настоящий тестовый набор? Типа на другом тестовом результаты могли бы выбрать другую модель? Тут уже вопрос репрезентативности выборки и других характеристик распределения данных

Serg Gini
Что такое настоящий тестовый набор? Типа на другом...

В моём понимании тестовый набор данных это набор данных который используется на самом последнем этапе для честной оценки качества модели, после этого этапа никакие подкрутки модели (в том числе выбор параметров или архитектуры) уже недопустимы

Serg Gini
Мы это называем валидационный)

Не буду спорить, так как на это есть различные мнения https://stats.stackexchange.com/questions/525697/why-is-it-that-my-colleagues-and-i-learned-opposite-definitions-for-test-and-val

Правильно я понимаю, что истинная функция неизвестна в принципе и просто какие-то N случайных датасетов, найденных «на улице»? Вопрос: можно ли оценить их схожесть с неизвестным эталоном? Я бы сказал что невозможно. Нельзя ответить на вопрос, который даже не сформулирован. Пример: есть 7 ответов от моделей, в какой день празднуют Новый год. Ответы от пн до вс. Какой верный?

I-L Автор вопроса
Ilya Shutov
Правильно я понимаю, что истинная функция неизвест...

Почти. Истинная функция не известна -- это да. Но с датасетами там сложнее. Просто посчитаны модели в сторонней програме (не мной), и вывалили в файл.

Раньше обычно на сцене появлялся экспат, тыкал пальцем и говорил «зуб даю, я ее узнал» и получал бонус. Но теперь правила игры поменялись.

I-L Автор вопроса
Ilya Shutov
Раньше обычно на сцене появлялся экспат, тыкал пал...

Ну так я за зубом прийти могу)) Поэтому не появляются.

I L
Почти. Истинная функция не известна -- это да. Но ...

Модели «доллар по 200»? Если метрик обучения нет — ну посчитайте отклонения от исходных данных, если есть такие точки, и ткните пальцем. Эффект примерно такой же, «мнк линейкой на глаз». Кому не понравится — пусть свою методу дает. Самое время место достать из ящика шар принятия решений.

I-L Автор вопроса
Ilya Shutov
Модели «доллар по 200»? Если метрик обучения нет...

Нет, с моделями доллар по 200 всё проще. Нет. Варианты расчёта для принятия решения. Так понимаю факторы одни, только разница где берут и за какое время.

I L
Нет, с моделями доллар по 200 всё проще. Нет. Вари...

Ну хорошо, проведем мысленный эксперимент. Снимем крышку с ящика моделей. А там видим вот что: Бородатые дядьки саентологи сидят в пабе, пьют пиво, кидают дартс и записывают результаты в качестве предикта. В конце обертывают ленточкой и отдают Вам, а полученные деньги передают бармену. Что-то меняется в ощущениях исходного вопроса?

I-L Автор вопроса
Ilya Shutov
Ну хорошо, проведем мысленный эксперимент. Снимем...

Хм. Хотел написать - Не меняется. Вроде на эти грабли давно не наступал. Похоже наступил. Буду думать.

I L
Хм. Хотел написать - Не меняется. Вроде на эти гра...

Я просто выступил оппонентом по исходному тексту. Устойчивая конструкция не должна рухнуть от легкого касания.

I-L Автор вопроса
Ilya Shutov
Я просто выступил оппонентом по исходному тексту. ...

Это отличные вопросы. В том то и дело, не уверен что конструкция рухнула, по крайней мере вижу пути по её упрочнению.

I-L Автор вопроса
Ilya Shutov
Я просто выступил оппонентом по исходному тексту. ...

Как всегда, взгляд со стороны помог. Особенно если это взгляд опытного человека.

I L
Это отличные вопросы. В том то и дело, не уверен ч...

Я на выходных тоже немного с бетоном возился.

I-L Автор вопроса
Ilya Shutov
Я на выходных тоже немного с бетоном возился.

Кто написал -- не помню. Любая история - это одна и таже история.

Ilya Shutov
Я на выходных тоже немного с бетоном возился.

Дискретка? Или бетон строительный?)

I L
Кто написал -- не помню. Любая история - это одна ...

Вы уверены что формулировка звучит именно так?

Ilya Shutov
screenshot

А чего Арматура не связана?)) и ячейки слишком мелковаты, как для обычного строительства. Будто бункер льёте ?)

@quadrivium
А чего Арматура не связана?)) и ячейки слишком мел...

хороший вопрос! ждал подобного. потому что картинка не моя, а демонстрационная :) https://beton-trans.ru/catalog/beton/beton-v-12-5-m-150/

I-L Автор вопроса
@quadrivium
Вы уверены что формулировка звучит именно так?

))) Строго говоря здесь две формулировки. В первой абсолютно уверен, не помню кто автор изречения. Во второй, настолько насколько можно быть уверенным в своей памяти.

I L
Кто написал -- не помню. Любая история - это одна ...

это вольный пересказ "четырех историй" Борхеса

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта