ML я выбрал себе задачу - хочу на tensorflow сделать сеть, которая обучается распознавать точки двух закрученных спиралей, как на playground.tensorflow.org. Я с максимальным старанием повторил архитектуру и датасет оригинала, даже залез в его жаваскрипт. Но у меня принципиально не получается заставить сеть научиться двум спиралям с архитектурой сети 4 слоя по 8 узлов. У меня для такого же качества обучения требуется как минимум 4 слоя по 50(!) узлов. Причем сеть учится дольше, а оптимизатор ставлю Adam (GradientDescentOptimizer вообще не алё что-то). Вот моя тетрадь юпитера на гитхабе, я попытался сделать её как можно более чисто и красиво https://github.com/Belerafon/Spiral-2.0/blob/master/Spiral.ipynb
Что я делаю не так? Подскажите, пожалуйта - я уже гиперпараметры второй день гоняю, но так хорошо как на сайте у меня даже близко не работает. Ёмкость сети получается нужно на порядок больше при любом исходе...
Преполагаю, что там все не совсем честно Например, они могут хитрую инициализацию использовать (какая у вас, кстати?)
вот этот пост
Фига сколько кода
Обсуждают сегодня