215 похожих чатов

Всем привет! Может быть кто-нибудь сможет что-то подсказать по следующему

вопросу?
Есть например 3 типа лиц: фл, ип и юл. Есть для них дата рождения, соответственно могу посчитать возраст. Однако если для ип и фл всё понятно, то для юл это дата создания компании. Понятно сравнивать возраст фл/ип и юл некорректно. Можно сделать новую бинарную переменную (является юл или нет), но чем тогда заменять значения возраста для юл в основной переменной возраст? -1 или 0 порушат распределение, ведь у лиц фл и ип возраст начинается от 18. Целевая задача сделать кластеризацию (без учителя) лиц по уровню дохода. Что бы кто мог посоветовать?

6 ответов

11 просмотров

Может применить масштабирование? И возраст компаний и возраст физиков привести к шкале 0...1

:D-L Автор вопроса
Роман
Может применить масштабирование? И возраст компани...

Да, но это хотел делать после решения вопроса с возрастом для юл, иначе же условно 0 лет будет 0 на шкале. В итоге все ИП и фл ощутимо сместятся на шкале вправо

:D L
Да, но это хотел делать после решения вопроса с во...

Не обязательно. Можно же сделать age / (max(age) - min(age)). И то же самое для компаний

:D-L Автор вопроса
Роман
Не обязательно. Можно же сделать age / (max(age) -...

Отдельно для каждого типа лиц? Т.е. сделать 3 новых переменных по каждому? Ведь нельзя же шкалировать по разным основаниям в одной переменной

:D L
Отдельно для каждого типа лиц? Т.е. сделать 3 новы...

Ну да. То есть для физиков получится к примеру age / (65-18), а для юриков age / (20 - 0).

:D-L Автор вопроса
Роман
Ну да. То есть для физиков получится к примеру age...

Спасибо. Тогда продолжая мысль будет 3 переменные для каждого лица. И тогда скажем для поля юл для юлов будут шкалированные значения, а для ИП и фл в этом поле тогда проставить 0. Но что бы не попортить настоящий ноль перед этим (до шкалирования) сделать +1 ко всем возрастам. Тогда на шкале по идее 0 (для ИП и фл) останется нулем, а минимальное значение (пусть даже 0) для юл будет уже хоть каким-то положительным. Вроде принципиальных противоречий при таком подходе не возникает: порядок шкалы сохраняется, отличие "искусственного" нуля от настоящего тоже. Так понимаю? Или это велосипед, коллеги?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта