Есть датасет с информацией об абонентах и нужно написать алгоритм, который бы находил одну и ту же персону.
Данных довольно много, думал о кластеризации. Но получится слишком много кластеров и точность хромать будет. Возможно это что-то типа рекомендательной системы?
Есть те кто сталкивался с задачами подобного рода?
Поиск дубликатов?
Обсуждают сегодня