В таких областях, как физика и техника, уравнения в частных производных (ЧДЭ) используются для моделирования сложных физических процессов, чтобы получить представление о том, как функционируют некоторые из самых сложных физических и природных систем в мире.
Для решения этих сложных уравнений исследователи используют высокоточные численные решатели, запуск которых может занять очень много времени и вычислительных затрат. Текущие упрощенные альтернативные суррогатные модели, управляемые данными, вычисляют целевое свойство решения УЧП, а не все решение в целом. Они обучаются на наборе данных, сгенерированных высокоточным решателем, для прогнозирования результатов УЧП для новых входных данных. Это требует больших объемов данных и является дорогостоящим, поскольку сложные физические системы требуют большого количества симуляций для генерации достаточного количества данных.
В новой статье «Расширенные физикой глубокие заменители уравнений в частных производных», опубликованной в декабре в журнале Природа Машинный интеллектпредлагается новый метод для разработки управляемых данными суррогатных моделей для сложных физических систем в таких областях, как механика, оптика, тепловой перенос, гидродинамика, физическая химия и модели климата.
Статья была написана профессором прикладной математики Массачусетского технологического института Стивеном Дж. Джонсоном вместе с Пайелом Дасом и Юсефом Мроу из MIT-IBM Watson AI Lab и IBM Research; Крис Ракаукас из Julia Lab; и Рафаэль Пестури, бывший постдок Массачусетского технологического института, который сейчас работает в Технологическом институте Джорджии. Авторы называют свой метод «глубоким суррогатом с улучшенной физикой» (PEDS), который сочетает в себе низкоточный, объяснимый физический симулятор с генератором нейронной сети. Генератор нейронной сети проходит сквозное обучение, чтобы соответствовать выходным данным высокоточного численного решателя.
«Мое стремление — заменить неэффективный процесс проб и ошибок систематическим компьютерным моделированием и оптимизацией», — говорит Пестури. «Недавние прорывы в области искусственного интеллекта, такие как большая языковая модель ChatGPT, основаны на сотнях миллиардов параметров и требуют огромного количества ресурсов для обучения и оценки. PEDS, напротив, доступен всем, поскольку он невероятно эффективен в использовании вычислительных ресурсов и имеет очень низкий барьер с точки зрения инфраструктуры, необходимой для его использования».
В статье они показывают, что суррогаты PEDS могут быть в три раза точнее, чем ансамбль нейронных сетей прямого распространения с ограниченными данными (примерно 1000 обучающих точек), и уменьшать объем обучающих данных, необходимых как минимум в 100 раз для достижения целевая ошибка 5 процентов. Этот научный метод машинного обучения, разработанный с использованием языка программирования Julia, разработанного Массачусетским технологическим институтом, эффективен как в вычислениях, так и в обработке данных.
Авторы также сообщают, что PEDS обеспечивает общую, основанную на данных стратегию, позволяющую преодолеть разрыв между огромным массивом упрощенных физических моделей и соответствующими численными решателями грубого подхода, моделирующими сложные системы. Этот метод обеспечивает точность, скорость, эффективность данных и физическое понимание процесса.
Говорит Пестури: «Начиная с 2000-х годов, по мере улучшения вычислительных возможностей, тенденция научных моделей заключалась в увеличении количества параметров для лучшего соответствия данным, иногда за счет более низкой точности прогнозирования. PEDS делает обратное, разумно выбирая параметры. Он использует технологию автоматического дифференцирования для обучения нейронной сети, которая делает модель с небольшим количеством параметров точной».
«Основной проблемой, которая препятствует более широкому использованию суррогатных моделей в инженерии, является проклятие размерности: тот факт, что необходимые данные для обучения модели увеличиваются экспоненциально с увеличением количества переменных модели», — говорит Пестури. «PEDS уменьшает это проклятие, объединяя информацию из данных и полевых знаний в форме решателя моделей с низкой точностью».
Исследователи говорят, что PEDS имеет потенциал возродить целый ряд литературы, написанной до 2000 года, посвященной минимальным моделям — интуитивным моделям, которые PEDS может сделать более точными, а также прогнозирующими для приложений суррогатных моделей.
«Применение структуры PEDS выходит за рамки того, что мы показали в этом исследовании», — говорит Дас. «Сложные физические системы, управляемые PDE, встречаются повсеместно, от моделирования климата до сейсмического моделирования и за его пределами. Наши основанные на физике быстрые и объяснимые суррогатные модели будут очень полезны в этих приложениях и играют дополняющую роль для других новых технологий, таких как модели фундамента».
Исследование было поддержано Лабораторией искусственного интеллекта Watson MIT-IBM и Исследовательским отделом армии США через Институт солдатских нанотехнологий.