Подробное описание вариационных автоэнкодеров | GPTMain News

Модель состоит из трех подсетей:

  1. Имея $x$ (изображение), закодируйте его в распределение по скрытому пространству — в предыдущем посте он упоминался как $Q(z|x)$.
  2. Имея $z$ в скрытом пространстве (кодовое представление изображения), декодируйте его в изображение, которое оно представляет — в предыдущем посте он упоминался как $f(z)$.
  3. Учитывая $x$, классифицируйте его цифру, сопоставив ее со слоем размера 10, где i-е значение содержит вероятность i-й цифры.

Первые две подсети — это ванильная структура VAE.

Третий используется как вспомогательная задача, которая задействует некоторые скрытые измерения для кодирования цифры, найденной на изображении. Позвольте мне объяснить мотивацию: в предыдущем посте я объяснил, что нам все равно, какую информацию содержит каждое измерение скрытого пространства. Модель может научиться кодировать любую информацию, которую она считает ценной для своей задачи. Поскольку мы знакомы с набором данных, мы знаем, что тип цифры должен быть важен. Мы хотим помочь модели, предоставив ей эту информацию. Более того, мы будем использовать эту информацию для создания изображений, зависящих от типа цифры, как я объясню позже.

Учитывая тип цифры, мы будем кодировать его, используя одно горячее кодирование, то есть вектор размера 10. Эти 10 чисел будут объединены в скрытый вектор, поэтому при декодировании этого вектора в изображение модель будет использовать цифровая информация.

Есть два способа предоставить модели один вектор горячего кодирования:

  1. Добавьте его в качестве входных данных в модель.
  2. Добавьте его как метку, чтобы модель должна была предсказывать его сама: мы добавим еще одну подсеть, которая предсказывает вектор размера 10, где потеря представляет собой перекрестную энтропию с ожидаемым одним горячим вектором.

Мы пойдем со вторым вариантом. Почему? Что ж, во время тестирования мы можем использовать модель двумя способами:

  1. Предоставьте изображение в качестве входных данных и выведите скрытый вектор.
  2. Предоставьте скрытый вектор в качестве входных данных и сгенерируйте изображение.

Поскольку мы хотим поддерживать и первый вариант, мы не можем предоставить модели цифру в качестве входных данных, так как мы не узнаем ее во время тестирования. Следовательно, модель должна научиться предсказывать его.

Теперь, когда мы понимаем все подсети, составляющие модель, мы можем закодировать их. Математические детали кодировщика и декодера можно найти в предыдущем посте.

Последние статьи

Related articles

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

hentai lou nicehentai.com ahegeo hentai pron v bigztube.mobi kannada school girl sex videos sxsi com pornoko.net indian porn xnxx.com سكس.جماعي pornigh.com سكس لوسي bangali sex in kompoz2.com ganapa kannada movie songs
سكس مع المعلمة matureporni.com سكس كس مفتوح desi clip.com foxporns.info girls sexy pictures хентай манга hentaitale.net hentai zombie girl little sister doujin justhentaiporn.com kasumi tendo hentai افلام جيانا مايكلز gratisfucktube.com foto sex
desi gay porn vedio momyporn.mobi nepali x video مدام شرموطه freetube18x.com ايناس الدغيدي سكس tony tony chopper hentai hentaimangaz.com naruto new hentai manga الكس والزبر pornarabic.net احلى بزاز ميلفاية arabgrid.net فلم\سكس