Работа над большей обобщаемостью искусственного интеллекта
Сегодня сезон конференций начинается с Десятой Международной конференции по обучению репрезентациям (ICLR 2022), которая пройдет виртуально с 25 по 29 апреля 2022 года. Участники со всего мира собираются, чтобы поделиться своими передовыми разработками в области репрезентативного обучения, начиная с передовых современное состояние искусственного интеллекта, науки о данных, машинного зрения, робототехники и многого другого.
В первый день конференции Пушмит Кохли, руководитель наших групп ИИ для науки, а также групп надежного и проверенного ИИ, выступит с докладом о том, как ИИ может значительно улучшить решения широкого спектра научных проблем, от геномики и структурной биологии до квантовой физики. химия и даже чистая математика.
Помимо поддержки мероприятия в качестве спонсоров и организаторов регулярных семинаров, наши исследовательские группы представили 29 статей, включая 10 совместных работ в этом году. Вот краткий обзор наших предстоящих устных, обзорных и стендовых презентаций:
Оптимизация обучения
Ряд ключевых статей посвящен важнейшим способам повышения эффективности процесса обучения наших систем искусственного интеллекта. Это варьируется от повышения производительности, улучшения обучения за несколько шагов и создания эффективных систем обработки данных, которые сокращают вычислительные затраты.
В книге «Самозагружаемое мета-обучение», получившей награду ICLR 2022 Outstanding Paper Award, мы предлагаем алгоритм, который позволяет агенту научиться учиться, обучая себя. Мы также представляем алгоритм улучшения политики, который модернизирует AlphaZero — нашу систему, которая с нуля обучалась овладению шахматами, сёги и го, — чтобы продолжать совершенствоваться даже при обучении с небольшим количеством симуляций; регуляризатор, который снижает риск потери емкости в широком диапазоне агентов и сред RL; и улучшенная архитектура для эффективной тренировки моделей внимания.
Исследование
Любопытство — ключевая часть человеческого обучения, помогающая совершенствовать знания и навыки. Точно так же механизмы исследования позволяют агентам ИИ выходить за рамки уже существующих знаний и открывать неизведанное или пробовать что-то новое.
Развивая вопрос «Когда агенты должны исследовать?», мы исследуем, когда агенты должны переключаться в режим исследования, в какие сроки имеет смысл переключаться и какие сигналы лучше всего определяют, насколько продолжительными и частыми должны быть периоды исследования. В другой статье мы вводим «бонус за получение информации», который позволяет агентам выйти за пределы ограничений, присущих RL, и получить возможность освоить больше навыков.
Надежный ИИ
Чтобы развернуть модели машинного обучения в реальном мире, они должны быть эффективными при переключении между обучением, тестированием и использованием новых наборов данных. Понимание причинных механизмов имеет важное значение, позволяя некоторым системам адаптироваться, в то время как другие с трудом справляются с новыми проблемами.
Расширяя исследования этих механизмов, мы представляем экспериментальную структуру, которая позволяет провести детальный анализ устойчивости к сдвигам распределения. Надежность также помогает защититься от враждебного вреда, как непреднамеренного, так и целенаправленного. В случае повреждения изображений мы предлагаем метод, который теоретически оптимизирует параметры моделей изображений, чтобы уменьшить эффекты размытия, тумана и других распространенных проблем.
Экстренная связь
Помимо помощи исследователям МО понять, как агенты развивают свое собственное общение для выполнения задач, агенты ИИ могут раскрыть понимание языкового поведения внутри популяций, что может привести к созданию более интерактивного и полезного ИИ.
Работая с исследователями из Inria, Google Research и Meta AI, мы связываем роль разнообразия в человеческих популяциях с формированием языка, чтобы частично решить очевидное противоречие в компьютерном моделировании с помощью нейронных агентов. Затем, поскольку создание лучшего представления языка в ИИ жизненно важно для понимания возникающей коммуникации, мы также исследуем важность увеличения набора данных, сложности задач и размера популяции как независимых аспектов. Более того, мы также изучили компромисс между выразительностью, сложностью и непредсказуемостью в играх, где несколько агентов общаются для достижения единой цели.
Полный спектр наших работ на ICLR 2022 смотрите здесь.