215 похожих чатов

Всем привет! Может быть кто-нибудь сможет что-то подсказать по следующему

вопросу?
Есть например 3 типа лиц: фл, ип и юл. Есть для них дата рождения, соответственно могу посчитать возраст. Однако если для ип и фл всё понятно, то для юл это дата создания компании. Понятно сравнивать возраст фл/ип и юл некорректно. Можно сделать новую бинарную переменную (является юл или нет), но чем тогда заменять значения возраста для юл в основной переменной возраст? -1 или 0 порушат распределение, ведь у лиц фл и ип возраст начинается от 18. Целевая задача сделать кластеризацию (без учителя) лиц по уровню дохода. Что бы кто мог посоветовать?

6 ответов

9 просмотров

Может применить масштабирование? И возраст компаний и возраст физиков привести к шкале 0...1

:D-L Автор вопроса
Роман
Может применить масштабирование? И возраст компани...

Да, но это хотел делать после решения вопроса с возрастом для юл, иначе же условно 0 лет будет 0 на шкале. В итоге все ИП и фл ощутимо сместятся на шкале вправо

:D L
Да, но это хотел делать после решения вопроса с во...

Не обязательно. Можно же сделать age / (max(age) - min(age)). И то же самое для компаний

:D-L Автор вопроса
Роман
Не обязательно. Можно же сделать age / (max(age) -...

Отдельно для каждого типа лиц? Т.е. сделать 3 новых переменных по каждому? Ведь нельзя же шкалировать по разным основаниям в одной переменной

:D L
Отдельно для каждого типа лиц? Т.е. сделать 3 новы...

Ну да. То есть для физиков получится к примеру age / (65-18), а для юриков age / (20 - 0).

:D-L Автор вопроса
Роман
Ну да. То есть для физиков получится к примеру age...

Спасибо. Тогда продолжая мысль будет 3 переменные для каждого лица. И тогда скажем для поля юл для юлов будут шкалированные значения, а для ИП и фл в этом поле тогда проставить 0. Но что бы не попортить настоящий ноль перед этим (до шкалирования) сделать +1 ко всем возрастам. Тогда на шкале по идее 0 (для ИП и фл) останется нулем, а минимальное значение (пусть даже 0) для юл будет уже хоть каким-то положительным. Вроде принципиальных противоречий при таком подходе не возникает: порядок шкалы сохраняется, отличие "искусственного" нуля от настоящего тоже. Так понимаю? Или это велосипед, коллеги?

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Ну вот просто даже давайте вот как. Какой нибудь конкретный кейс, можете в пример привести, где бч работает и приносит прикладную пользу, а не просто что бы было? Не крипту.
Alexander Andreev
22
объясните пожалуйста, почему функция не работает должным образом? вроде должно брать активное окно сравнивать его размер с размером экрана, и если есть совпадение = true прове...
JF
12
> Копаем глубже > Следующий момент был, когда я спросил его, знает ли он JavaScript. Он ответил, что его учили работать с C#. Я тоже в университете писал на C#, но даже там мн...
Oleg Volkov
4
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
8
Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Карта сайта