215 похожих чатов

И проблема ещё скорее не в том, что у меня

плохо генерируется. У меня просто никак не меняются loss. Хотя бы как-то улучшаться оно же все таки должно? Может надо другую функцию потерь выбрать?

4 ответов

22 просмотра

Интересная у вас архитектура. Ну во первых-reshape с последующим dense слоем очень плохая операция, поскольку параметров у dense будет очень много (988тыс*128, если я правильно помню как керас работает) и сеть может вообще не обучиться, надо разбираться как архитектуру подобрать, наугад, у вас наврядли что-то получится. Во-вторых вы не упомянули, меняли ли вы learning rate, если он слишком маленький ,сеть не будет вообще учиться. В-третьих две эпохи - это очень мало, однако если лосс на первых итерациях вообще не меняется то нужно решить проблемы, в предыдущих пунктах. mse как лосс для картинок обычно вообще не годится, сейчас используют perceptual loss, но для бейзлайна подойет и ваш. Еще есть вероятность, что у вас все правильно, но нужно дольше поучиться, для этого зафиксируйте батч, подавайте один и тот же все время, если обучится, значит, все у вас правильно и нужно поставить тренировку на очень долгое время с нормальным батчем. Ну и керас, конечно, хороший фреймворк, но для таких задач лучше использовать что-то более современное, типа торча.

Благой-Димитров Автор вопроса
Vlad Sorokin
Интересная у вас архитектура. Ну во первых-reshap...

> зафиксируйте батч, подавайте один и тот же все время вы имеете в виду размер батча? > во первых-reshape с последующим dense слоем очень плохая операция Видимо Dense слой в этой ситуации надо оставить (иначе мне не получить 216000 = 24 * 50 * 60 * 3 нейронов). Но как тогда мне перейти после Conv2D слоев в Dense слою? > learning_rate я вообще не ставил, щас буду разбираться, что там по дефолту и попробую поменять

Благой Димитров
> зафиксируйте батч, подавайте один и тот же все в...

Зафиксировать батч значит, что картинки и звук будет всегда одни и те же на каждой итерации тренировки, делается это только для тестирования сети, чтобы узнать, а она вообще обучиться может. к Dense слою необязательно переходить, есть полносверточные сети, которые работают чисто на свертках, как, кстати, на картинке в работе которую вы пытаетесь реализовать.

Благой-Димитров Автор вопроса
Vlad Sorokin
Интересная у вас архитектура. Ну во первых-reshap...

Я поигрался с learning_rate. По дефолту там 0.001. Я менял При learning_rate < 1 ситуация не меняется почти. Однако чем больше, тем быстрее оно начинает обучаться. При learning_rate 10 оно начинает обучаться за 1 эпоху. loss: 0.2221 - accuracy: 0.8832

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Ну вот просто даже давайте вот как. Какой нибудь конкретный кейс, можете в пример привести, где бч работает и приносит прикладную пользу, а не просто что бы было? Не крипту.
Alexander Andreev
22
объясните пожалуйста, почему функция не работает должным образом? вроде должно брать активное окно сравнивать его размер с размером экрана, и если есть совпадение = true прове...
JF
12
Гляньте, че бывает: Сегодня по одному проекту одной вебстудии делал проект небольшой, на их хостинге. На Modx revo. В определенный момент , работая в админке, вдруг перестал р...
Artem
7
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
12
> Копаем глубже > Следующий момент был, когда я спросил его, знает ли он JavaScript. Он ответил, что его учили работать с C#. Я тоже в университете писал на C#, но даже там мн...
Oleg Volkov
4
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
Кто нибудь либу Zstandart использовал ? Это либа для сжатия от Цукерберга
Andrey Electron
9
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Карта сайта