Как MuZero, AlphaZero и AlphaDev помогают оптимизировать всю вычислительную экосистему, которая питает наш мир устройств
Алгоритмы искусственного интеллекта (ИИ) с каждым днем становятся все более сложными, каждый из них призван решить проблему наилучшим образом. В рамках наших усилий по созданию все более способных и общих систем ИИ мы работаем над созданием инструментов ИИ с широким пониманием мира, чтобы полезные знания можно было передавать между различными типами задач.
Наши модели ИИ AlphaZero и MuZero, основанные на обучении с подкреплением, достигли сверхчеловеческой производительности, выигрывая игры. Теперь они расширяют свои возможности, помогая оптимизировать центры обработки данных и сжатие видео, а совсем недавно наша специализированная версия AlphaZero, названная AlphaDev, обнаружила новые алгоритмы, которые уже ускоряют программное обеспечение, лежащее в основе нашего цифрового общества.
Хотя эти инструменты создают скачок в эффективности всей вычислительной экосистемы, первые результаты показывают преобразующий потенциал более универсальных инструментов ИИ. Здесь мы объясним, как эти достижения формируют будущее вычислений и уже помогают миллиардам людей и планете.
Оптимизация ресурсов центра обработки данных
Центры обработки данных управляют всем – от предоставления результатов поиска до обработки наборов данных. Borg управляет миллиардами задач в Google, распределение этих рабочих нагрузок похоже на игру в многомерный “Тетрис”. Эта система помогает оптимизировать задачи для внутренних инфраструктурных служб, продуктов, ориентированных на пользователя, таких как Google Workspace и Search, а также управляет пакетной обработкой данных.
Для управления этой рабочей нагрузкой Borg использует правила планирования задач, составленные вручную. В масштабах Google эти правила, составленные вручную, не могут учитывать разнообразие постоянно меняющихся распределений рабочей нагрузки, поэтому они разработаны как “одноразовые”. для лучшего подходить всем”. Именно здесь особенно полезны технологии машинного обучения, такие как AlphaZero: эти алгоритмы способны автоматически создавать индивидуальные оптимально подобранные правила, которые более эффективны для различных распределений рабочей нагрузки.
В процессе обучения AlphaZero научился распознавать закономерности в задачах, поступающих в центры обработки данных, а также научился предсказывать наилучшие способы управления мощностями и принимать решения с наилучшими долгосрочными результатами.
Когда мы применили AlphaZero к Borg, экспериментальные испытания на производстве показали, что этот подход может сократить количество недоиспользуемого оборудования на 19%, оптимизируя использование ресурсов центров обработки данных Google.

Следующие шаги для сжатия видео
Потоковое видео составляет большую часть интернет-трафика, потребляя огромное количество данных. Поэтому поиск эффективных решений в этом процессе, больших или малых, окажет огромное влияние на миллионы людей, ежедневно просматривающих видео.
В прошлом году мы сотрудничали с YouTube, чтобы применить способности MuZero к решению проблем, помогая сжимать и передавать видео. Снизив битрейт на 4% без ущерба для визуального качества, MuZero улучшил общее впечатление от YouTube.
Сначала мы использовали MuZero для оптимизации сжатия каждого отдельного кадра в видео. Теперь мы расширили эту работу, чтобы принимать решения о том, как кадры группируются и ссылаются во время кодирования, что привело к еще большей экономии битрейта.
Первые результаты этих первых двух шагов показывают, что MuZero может стать более универсальным инструментом, помогающим находить оптимальные решения во всем процессе сжатия видео.

Поиск более быстрых алгоритмов
Совсем недавно AlphaDev, версия AlphaZero, совершила новый прорыв в компьютерной науке, открыв более быстрые алгоритмы сортировки и хэширования – два фундаментальных процесса, используемых триллионы раз в день для сортировки, хранения и извлечения данных.
Алгоритмы сортировки влияют на то, как все цифровые устройства обрабатывают и отображают информацию, от ранжирования результатов онлайн-поиска и социальных постов до пользовательских рекомендаций. AlphaDev обнаружила алгоритм, который повышает эффективность сортировки коротких последовательностей элементов на 70% и примерно на 1,7% для последовательностей из более чем 250 000 элементов, по сравнению с алгоритмами в библиотеке C++. Таким образом, когда пользователь отправляет поисковый запрос, алгоритм AlphaDev может помочь быстрее отсортировать результаты. При масштабном использовании он экономит огромное количество времени и энергии.

AlphaDev также обнаружила более быстрый алгоритм хэширования информации, который часто используется для хранения и поиска данных, например, в базе данных клиентов. Алгоритмы хэширования обычно используют ключ (например, имя пользователя “Jane Doe”) для генерации уникального хэша, который соответствует значениям данных, которые необходимо извлечь (например, “номер заказа 164335-87”).
Подобно библиотекарю, который использует систему классификации для быстрого поиска определенной книги, при использовании системы хэширования компьютер уже знает, что он ищет и где это найти. Когда алгоритм AlphaDev был применен к диапазону хэширования 9-16 байт в центрах обработки данных, он повысил эффективность на 30%.
После выпуска алгоритмов сортировки в стандартной библиотеке C++ LLVM – замены подпрограмм, которые использовались более десяти лет, на генерируемые RL – и алгоритмов хэширования в библиотеке abseil, миллионы разработчиков и компаний теперь используют эти алгоритмы в таких отраслях, как облачные вычисления, интернет-магазины и управление цепочками поставок.

Инструменты общего назначения для нашего цифрового будущего
От игр до решения сложных инженерных задач, лежащих в основе каждого устройства, наши инструменты ИИ экономят время и энергию миллиардов людей. И это только начало.
Мы представляем себе будущее, в котором инструменты ИИ общего назначения помогут оптимизировать всю вычислительную экосистему, обеспечивающую работу нашего цифрового мира. Но для поддержки этих инструментов нам понадобится более быстрая, более эффективная и более устойчивая цифровая инфраструктура.
Для создания полностью обобщенных инструментов ИИ необходимо совершить еще много теоретических и технологических прорывов. Трансформационный потенциал инструментов ИИ общего назначения и то, как они могут быть применены для решения различных задач в области технологий, науки и медицины. Мы с нетерпением ждем, что нас ждет в будущем.
Узнайте больше об алгоритмах сортировки: