Глубокое обучение без учителя выявляет семантическое распутывание в отдельных нейронах нижневисочных участков лица | GPTMain News

Наш мозг обладает удивительной способностью обрабатывать визуальную информацию. Мы можем взглянуть на сложную сцену одним взглядом и за миллисекунды разобрать ее на объекты и их атрибуты, такие как цвет или размер, и использовать эту информацию для описания сцены простым языком. В основе этой, казалось бы, легкой способности лежат сложные вычисления, выполняемые нашей зрительной корой, которые включают в себя получение миллионов нервных импульсов, передаваемых от сетчатки, и преобразование их в более значимую форму, которую можно отобразить в простом языковом описании. Чтобы полностью понять, как этот процесс работает в мозге, нам необходимо выяснить, как семантически значимая информация представляется при срабатывании нейронов в конце иерархии визуальной обработки, и как такое представление может быть получено на основе необученный опыт.

Чтобы ответить на эти вопросы в контексте восприятия лиц, мы объединили усилия с нашими сотрудниками из Калифорнийского технологического института (Дорис Цао) и Китайской академии наук (Ле Чанг). Мы выбрали лица, потому что они хорошо изучены в нейробиологическом сообществе и часто рассматриваются как «микрокосм распознавания объектов». В частности, мы хотели сравнить реакции отдельных корковых нейронов на участках лица в конце иерархии визуальной обработки, записанные нашими сотрудниками, с недавно появившимся классом так называемых «распутывающих» глубоких нейронных сетей, которые, в отличие от обычных «распутывающих» глубоких нейронных сетей, Системы «черного ящика» явно нацелены на то, чтобы их можно было интерпретировать для людей. «Распутывающая» нейронная сеть учится отображать сложные изображения в небольшое количество внутренних нейронов (называемых скрытыми единицами), каждый из которых представляет один семантически значимый атрибут сцены, например цвет или размер объекта (см. Рисунок 1). В отличие от глубоких классификаторов «черного ящика», обученных распознавать визуальные объекты посредством биологически нереалистичного внешнего контроля, такие распутывающие модели обучаются без внешнего обучающего сигнала с использованием самоконтролируемой цели реконструкции входных изображений (генерация на рисунке 1) из их изображений. выученное скрытое представление (полученное посредством вывода на рисунке 1).

Почти десять лет назад было высказано предположение, что распутывание важно в сообществе машинного обучения как неотъемлемый компонент для создания более эффективных, передаваемых, справедливых и творческих систем искусственного интеллекта. Однако в течение многих лет построение модели, которая могла бы распутать ситуацию на практике, ускользало от поля зрения. Первая модель, способная сделать это успешно и надежно, названная β-VAE, была разработана на основе нейробиологии: β-VAE учится, прогнозируя свои собственные входные данные; для успешного обучения требуется такой же визуальный опыт, как и у младенцев; и его выученное скрытое представление отражает свойства, известные зрительному мозгу.

В нашей новой статье мы измерили степень, в которой распутанные единицы, обнаруженные с помощью β-VAE, обученного на наборе данных изображений лиц, похожи на реакции отдельных нейронов в конце визуальной обработки, записанной у приматов, смотрящих на одни и те же лица. . Нейронные данные были собраны нашими сотрудниками под строгим контролем со стороны Институционального комитета по уходу и использованию животных Калифорнийского технологического института. Когда мы провели сравнение, мы обнаружили нечто удивительное: казалось, что несколько распутанных единиц, обнаруженных с помощью β-VAE, вели себя так, как если бы они были эквивалентны подмножеству реальных нейронов аналогичного размера. Присмотревшись, мы обнаружили сильное взаимно однозначное соответствие между настоящими нейронами и искусственными (см. рисунок 2). Это отображение было намного сильнее, чем у альтернативных моделей, включая глубокие классификаторы, которые ранее считались современными вычислительными моделями визуальной обработки, или созданную вручную модель восприятия лиц, считающуюся «золотым стандартом» в нейробиологическом сообществе. Мало того, единицы β-VAE кодировали семантически значимую информацию, такую ​​​​как возраст, пол, размер глаз или наличие улыбки, что позволило нам понять, какие атрибуты отдельные нейроны в мозге используют для представления лиц.

Если бы β-VAE действительно смог автоматически обнаруживать искусственные латентные единицы, которые эквивалентны реальным нейронам с точки зрения того, как они реагируют на изображения лиц, тогда должна быть возможность перевести активность реальных нейронов в их соответствующие искусственные аналоги и использовать генератор (см. рисунок 1) обученного β-VAE для визуализации того, что представляют собой лица реальных нейронов. Чтобы проверить это, мы предоставили приматам новые изображения лиц, которых модель никогда не видела, и проверили, сможем ли мы их визуализировать с помощью генератора β-VAE (см. рисунок 3). Мы обнаружили, что это действительно возможно. Используя активность всего 12 нейронов, мы смогли генерировать изображения лиц, которые были более точной реконструкцией оригиналов и имели лучшее визуальное качество, чем те, которые создавались с помощью альтернативных глубоких генеративных моделей. И это несмотря на то, что альтернативные модели, как известно, являются лучшими генераторами изображений, чем β-VAE в целом.

Наши результаты, обобщенные в новой статье, показывают, что зрительный мозг можно понять на уровне одного нейрона, даже в конце его иерархии обработки. Это противоречит распространенному мнению, что семантически значимая информация мультиплексируется между большим количеством таких нейронов, причем каждый из них остается в значительной степени неинтерпретируемым индивидуально, мало чем отличаясь от того, как информация кодируется в полных слоях искусственных нейронов в глубоких классификаторах. Мало того, наши результаты показывают, что вполне возможно, что мозг учится поддерживать нашу способность без усилий осуществлять зрительное восприятие, оптимизируя задачу распутывания. Хотя β-VAE изначально был разработан на основе принципов нейронауки высокого уровня, полезность распутанных представлений для интеллектуального поведения до сих пор была продемонстрирована в первую очередь в сообществе машинного обучения. Учитывая богатую историю взаимовыгодного взаимодействия нейробиологии и машинного обучения, мы надеемся, что последние открытия в области машинного обучения теперь смогут вернуться к сообществу нейробиологов, чтобы изучить преимущества распутанных представлений для поддержки интеллекта в биологических системах, в частности, как основу для абстрактного рассуждения или обобщаемого и эффективного обучения задачам.

Последние статьи

Related articles

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

hentai lou nicehentai.com ahegeo hentai pron v bigztube.mobi kannada school girl sex videos sxsi com pornoko.net indian porn xnxx.com سكس.جماعي pornigh.com سكس لوسي bangali sex in kompoz2.com ganapa kannada movie songs
سكس مع المعلمة matureporni.com سكس كس مفتوح desi clip.com foxporns.info girls sexy pictures хентай манга hentaitale.net hentai zombie girl little sister doujin justhentaiporn.com kasumi tendo hentai افلام جيانا مايكلز gratisfucktube.com foto sex
desi gay porn vedio momyporn.mobi nepali x video مدام شرموطه freetube18x.com ايناس الدغيدي سكس tony tony chopper hentai hentaimangaz.com naruto new hentai manga الكس والزبر pornarabic.net احلى بزاز ميلفاية arabgrid.net فلم\سكس