В июле 2022 года мы опубликовали прогнозы структуры белка AlphaFold почти для всех известных науке каталогизированных белков. Читать последний блог здесь.
Сегодня я невероятно горд и взволнован, чтобы объявить, что DeepMind вносит значительный вклад в понимание человечеством биологии.
Когда в декабре прошлого года мы объявили об AlphaFold 2, его приветствовали как решение 50-летней проблемы сворачивания белков. На прошлой неделе мы опубликовали научную статью и исходный код, объясняющие, как мы создали эту инновационную систему, а сегодня мы делимся высококачественными прогнозами формы каждого отдельного белка в организме человека, а также белков 20 дополнительные организмы, на которые ученые полагаются в своих исследованиях.
По мере того, как исследователи ищут лекарства от болезней и ищут решения других серьезных проблем, стоящих перед человечеством, включая устойчивость к антибиотикам, загрязнение микропластиком и изменение климата, им будет полезно новое понимание структуры белков. Белки подобны крошечным изысканным биологическим машинам. Точно так же, как структура машины говорит вам, что она делает, так и структура белка помогает нам понять его функцию. Сегодня мы делимся кладезем информации, которая удваивает понимание человечеством протеома человека и раскрывает белковые структуры, обнаруженные в 20 других биологически значимых организмах, от кишечной палочки до дрожжей и от плодовой мухи до мыши.
Это будет один из самых важных наборов данных с момента картирования генома человека.
Эван Бирни, заместитель генерального директора EMBL и директор EMBL-EBI
Как мощный инструмент, который поддерживает усилия исследователей, мы считаем, что это самый значительный вклад ИИ в развитие научных знаний на сегодняшний день и отличный пример преимуществ, которые ИИ может принести человечеству. Эти идеи будут лежать в основе многих захватывающих будущих достижений в нашем понимании биологии и медицины. Благодаря пяти годам неустанной работы и большой изобретательности команды AlphaFold, а также тесному сотрудничеству в течение последних нескольких месяцев с нашими партнерами из Европейского института биоинформатики EMBL (EMBL-EBI), мы можем поделиться этим огромным и ценным ресурсом с мир.
Эта последняя работа основана на объявлениях, которые мы сделали в декабре прошлого года на конференции CASP14, когда DeepMind представила радикально новую версию нашей системы AlphaFold, которая была признана организаторами оценки решением 50-летней грандиозной проблемы понимания. трехмерная структура белков. Экспериментальное определение белковых структур — это трудоемкая и кропотливая работа, но AlphaFold продемонстрировала, что ИИ может точно предсказывать форму белка в масштабе и за минуты с точностью до атома. В CASP мы обязались делиться своими методами и предоставлять широкий доступ к этой совокупности знаний.
В этом месяце мы завершили огромный объем тяжелой работы, чтобы выполнить это обязательство. Мы опубликовали две рецензируемые статьи в Природа (1,2) и код AlphaFold с открытым исходным кодом. Сегодня в партнерстве с EMBL-EBI мы невероятно гордимся тем, что запускаем базу данных AlphaFold Protein Structure Database, которая предлагает наиболее полную и точную картину протеома человека на сегодняшний день, более чем вдвое увеличивая накопленные человечеством знания о высокоточных белках человека. структуры.
В дополнение к протеому человека (все ~20 000 белков, экспрессируемых геномом человека), мы предоставляем открытый доступ к протеомам 20 других биологически значимых организмов, в общей сложности более 350 000 белковых структур. Исследования этих организмов были предметом бесчисленных исследовательских работ и многочисленных крупных прорывов и привели к более глубокому пониманию самой жизни. В ближайшие месяцы мы планируем значительно расширить охват почти каждому секвенированному белку, известному науке – более 100 миллионов структур, покрывающих большую часть справочной базы данных UniProt. Это настоящий белковый альманах мира. И система, и база данных будут периодически обновляться, поскольку мы продолжаем вкладывать средства в будущие усовершенствования AlphaFold.
Самое интересное, что в руках ученых всего мира этот новый белковый альманах позволит и ускорит исследования, которые улучшат наше понимание этих строительных блоков жизни. Уже в ходе нашего раннего сотрудничества мы видели многообещающие сигналы от исследователей, использующих AlphaFold в своей работе. Например, Инициатива «Лекарства от забытых болезней» (DNDi) продвинула свои исследования спасительных средств от болезней, которые непропорционально поражают более бедные части мира, а Центр ферментных инноваций Портсмутского университета (CEI) использует AlphaFold. чтобы помочь разработать более быстрые ферменты для переработки некоторых из наших самых загрязняющих одноразовых пластиков. Тем ученым, которые полагаются на экспериментальное определение структуры белка, прогнозы AlphaFold помогли ускорить их исследования. В качестве другого примера: команда из Университета Колорадо в Боулдере находит многообещающим использование прогнозов AlphaFold для изучения устойчивости к антибиотикам, в то время как группа из Калифорнийского университета в Сан-Франциско использовала их для углубления своего понимания биологии SARS-CoV-2. И это только начало того, что, как мы надеемся, станет революцией в структурной биоинформатике. С появлением AlphaFold в мире существует кладезь данных, ожидающих превращения в будущие достижения.
AlphaFold открывает новые горизонты исследований, и нас вдохновляет видеть, как мощный передовой ИИ позволяет работать с болезнями, которые сосредоточены почти исключительно в бедных слоях населения.
– Бен Перри, лидер открытых инноваций Discovery, Инициатива «Лекарства от забытых болезней» (DNDi)
Для команды AlphaFold в DeepMind эта работа представляет собой кульминацию пяти лет огромных усилий, в том числе необходимости творчески преодолевать множество сложных неудач, что привело к множеству новых сложных алгоритмических инноваций, которые были необходимы для окончательного решения проблемы. Он основан на открытиях поколений ученых, от первых пионеров белковой визуализации и кристаллографии до тысяч специалистов по предсказаниям и структурных биологов, которые с тех пор провели годы, экспериментируя с белками. Мы мечтаем о том, чтобы AlphaFold, предоставляя это фундаментальное понимание, помогла бесчисленному количеству ученых в их работе и открыла совершенно новые возможности для научных открытий.
То, на что у нас уходили месяцы и годы, AlphaFold смогла сделать за выходные.
– Профессор Джон МакГихан, профессор структурной биологии и директор Центра инноваций в области ферментов (CEI) Портсмутского университета.
Мы в DeepMind всегда исходили из того, что искусственный интеллект может значительно ускорить прорывы во многих областях науки и, в свою очередь, продвинуть вперед человечество. Мы создали AlphaFold и базу данных белковых структур AlphaFold, чтобы поддержать и повысить эффективность усилий ученых всего мира в важной работе, которую они выполняют. Мы считаем, что искусственный интеллект может революционизировать науку в 21 веке, и мы с нетерпением ждем открытий, которые AlphaFold может помочь научному сообществу открыть в будущем.
Чтобы узнать больше, зайдите на сайт Nature, чтобы прочитать наши рецензируемые статьи, описывающие наш полный метод и человеческий протеом. Подробнее о них можно прочитать в нашем техническом блоге. Если вы хотите изучить нашу систему, вот код с открытым исходным кодом для ноутбуков AlphaFold и Colab для запуска отдельных последовательностей. Чтобы исследовать наши структуры, EMBL-EBI, мировой лидер в области биологических данных, размещает их в базе данных с возможностью поиска, которая открыта и бесплатна для всех.
Мы хотели бы услышать ваши отзывы и понять, насколько AlphaFold был полезен в вашем исследовании. Поделитесь своими историями на alphafold@deepmind.com.