Прокладывая путь для универсальных систем с более эффективным и действенным искусственным интеллектом
Начиная с этих выходных, тридцать девятая Международная конференция по машинному обучению (ICML 2022) пройдет с 17 по 23 июля 2022 года в Балтиморском конференц-центре в Мэриленде, США, и будет проводиться как гибридное мероприятие.
Исследователи, работающие в области искусственного интеллекта, науки о данных, машинного зрения, вычислительной биологии, распознавания речи и т. д., представляют и публикуют свои передовые разработки в области машинного обучения.
Помимо спонсирования конференции и поддержки семинаров и социальных сетей, проводимых нашими давними партнерами LatinX, Black in AI, Queer in AI и Women in Machine Learning, наши исследовательские группы представляют 30 статей, в том числе 17 внешних совместных работ. Вот краткое введение в наши предстоящие устные и тематические презентации:
Эффективное обучение с подкреплением
Повышение эффективности алгоритмов обучения с подкреплением (RL) является ключом к созданию обобщенных систем ИИ. Это включает в себя помощь в повышении точности и скорости работы, улучшении передачи и обучения с нуля, а также снижении вычислительных затрат.
В одной из выбранных нами устных презентаций мы показываем новый способ применения обобщенного улучшения политик (GPI) к композициям политик, что делает его еще более эффективным для повышения производительности агента. В другой устной презентации был предложен новый обоснованный и масштабируемый способ эффективного исследования без необходимости бонусов. Параллельно мы предлагаем метод дополнения агента RL процессом поиска в памяти, уменьшая зависимость агента от возможностей его модели и позволяя быстро и гибко использовать прошлый опыт.
Прогресс в языковых моделях
Язык является фундаментальной частью человеческого бытия. Это дает людям возможность обмениваться мыслями и концепциями, создавать воспоминания и строить взаимопонимание. Изучение аспектов языка является ключом к пониманию того, как работает интеллект как в системах искусственного интеллекта, так и у людей.
Наша устная презентация об унифицированных законах масштабирования и наша статья о поиске оба исследуют, как мы можем более эффективно создавать более крупные языковые модели. Рассматривая способы создания более эффективных языковых моделей, мы представляем новый набор данных и тест с StreamingQA, который оценивает, как модели адаптируются к новым знаниям и забывают их с течением времени, в то время как наша статья о создании нарративов показывает, как современные предварительно обученные языковые модели все еще борются с созданием более длинных текстов из-за ограничений кратковременной памяти.
Алгоритмическое мышление
Нейронно-алгоритмическое мышление — это искусство построения нейронных сетей, которые могут выполнять алгоритмические вычисления. Эта растущая область исследований имеет большой потенциал для адаптации известных алгоритмов к реальным задачам.
Мы представляем тест CLRS для алгоритмического мышления, который оценивает нейронные сети при выполнении разнообразного набора из тридцати классических алгоритмов из учебника «Введение в алгоритмы». Кроме того, мы предлагаем общий алгоритм пошагового обучения, который адаптирует воспроизведение ретроспективного опыта к автоматизированному доказательству теорем, что является важным инструментом, помогающим математикам доказывать сложные теоремы. Кроме того, мы представляем основу для обучения на основе ограничений, показывающую, как традиционное моделирование и численные методы могут использоваться в симуляторах машинного обучения — важное новое направление для решения сложных задач моделирования в науке и технике.
Посмотреть полный спектр нашей работы на ICML 2022 можно здесь.