215 похожих чатов

Хорошо) У меня 3 вопроса, они на самом деле между собой

связаны. Самый важный - третий, но я буду очень рад если вы поможете и с двумя остальными.

1) Если мы решаем задачу генерации объекта, то после того, как мы обучили нашу нейронную сеть и получили обученный генератор и дискриминатор, то верно ли я понимаю, что дискриминатор нам больше не нужен и все что мы будем использать для генерации это генератор?

2) Если посмотреть на генерацию чисел из набора MNIST, то в начале туда подается «шум». Я понимаю зачем он нужен при обучении, но я совсем не понимаю как потом пользоваться генератором для генерации объекта. Шум же не дает сгенерировать нужное число, он рандомный и соответсвенно рандомное число мы получаем на выходе из генератора. Или это так и задумывалось? Что делать если я хочу уметь генерировать КОНКРЕТНУЮ цифру.

3) У меня стоит задача, создать генератор движения губ. То есть нейронную сеть, генерирующую по аудио и первому кадру лица - последующие кадры, где губы уже двигаются (т.е. аудиозапись + фото человека -> видеозапись говорящего человека). Вопрос: что в таком случае мне надо подавать на вход генератору? Аудиозапись, фото и шум? или шум не надо? Или Аудиозапись и шум (вместо фото).



Если интересно, вот статья на которую я ориентируюсь при написании GAN:
https://neurohive.io/ru/osnovy-data-science/gan-rukovodstvo-dlja-novichkov/

4 ответов

34 просмотра

1. да, но иногда дискриминаторы нужны для задачи определения фейка 2. либо как предложили ранее conditional gan, либо для каждой цифры отдельная модель. 3. задача поставлена так, как будто ган не нужен. но если хочется прикрутить именно ганы, то нет - шум не нужен. звука и лица вполне достаточно для генерации. шум использьуется когда нет нормального входа, а хочется генерировать разные объекты

Благой-Димитров Автор вопроса
Vlad Sorokin
1. да, но иногда дискриминаторы нужны для задачи о...

> задача поставлена так, как будто ган не нужен Почему ты так думаешь? У нас же стоит задача генерации объекта, генерация лица, губ

смотри, если ты знаешь что точно идет на вход и точно будет на выходе - это обычный supervised learning. в твоем случае у тебя, скорее всего, есть данные, что на вход, допустим, первый кадр из видеопотока и звук, а на выходе все остальные кадры, сопоставленные со звуком. ган в этой задаче, скорее всего, может помочь определять насколько лицо реально и добавить его можно как дополнительную функцию ошибки у модели, но это не выглядит как главная часть архитектуры. я могу быть не прав, если ты подробнее расскажешь как будет выглядеть обучение модели, но на абстрактном уровне просто использование ганов не выглядит рабочим вариантом, поскольку дискриминатор придется переделать на более хитрый

Благой-Димитров Автор вопроса
Vlad Sorokin
смотри, если ты знаешь что точно идет на вход и то...

Ну, видимо, да, дискриминатор стоит добавлять только для улучшения четкости и резкости изображения. Я планировал представлять фото как вектор, конкатенировать его с аудиопризнаками и просто подавать получившийся вектор целиком на вход в генератор. На выходе хотел получать вектор (несколько подряд идущих фотографий). В качестве функции потерь я бы взял среднюю абсолютную ошибку. Ты про это спрашивал?)

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта