мужчин, как ты это сделаешь?
Тут куча вопросов про то какими инструментами можно пользоваться и что с наличием размеченных данных
дай угадаю, провести токенизацию, потом векторизацию и потом кластеризацию?
самое просто по роду, но часть фамилий не склоняется значит нужно искать доп поля, типа имени
Как ты токенизируешь одиночные слова?
И тут в чат врываются небинарные транс цис тела с вагинами и тд и удачи)
так очевидно, ты же Вячеслав с:
Блять, Вячеслав это не фамилия )))
засада, значит ты исключение!
я - добавлю колонку GENDER, типа NVARCHAR(8)
А че 8, если male/female и других фантазёров не считаем?
в свободной форме, пусть хоть ч пишут, но не слишком рассрабляются
В русской фамилии, женские заканчиваются на согласные(Иванова, сидорова, Петрова). Сначала по такому критерию, потом только по имени будет ясно
Обсуждают сегодня