было по количеству времени просмотра определенных передач в день за неделю определить пол, возраст, и другие характеристики человека. В итоге запустили lstm, делили всяко разно на тестовую и обучающую выборку много раз, соотноешние обучающей выборке к тестируемой была 8:2, точность была всегда 100%. Сеть была не слишком большая (30 юнитов), но такая странная проблема. Может у них какой-то косяк был с данными. Так и не понял, как лучше всего действовать в такой ситуации, не говорить же, что есть сетка, которая со 100% вероятностью может определить характеристики человека. Потом дали валидационную выборку, которая была размером с изначальную, там тоже точность была 100%. Что в такой ситуации стоит делать?
Говорить, что сетка со 100% точностью определяет характеристики человека :)
вангую кривой датасэт
Обсуждают сегодня