Ученые Массачусетского технологического института создают систему, которая может генерировать модели искусственного интеллекта для биологических исследований | Новости Массачусетского технологического института | GPTMain News

Можно ли создавать модели машинного обучения без опыта машинного обучения?

Джим Коллинз, профессор медицинской инженерии и науки в Термеере на кафедре биологической инженерии в Массачусетском технологическом институте и руководитель факультета наук о жизни в Клинике машинного обучения Абдула Латифа Джамиля (клиника Джамиля), вместе с рядом коллег решили заняться эта проблема при столкновении с подобной загадкой. Статья в открытом доступе об их предложенном решении под названием BioAutoMATED была опубликована 21 июня в Клеточные системы.

Наем исследователей машинного обучения может быть трудоемким и финансово затратным процессом для научных и инженерных лабораторий. Даже с экспертом по машинному обучению выбор подходящей модели, форматирование набора данных для модели, а затем ее точная настройка могут кардинально изменить работу модели и требуют много работы.

«В вашем проекте машинного обучения, сколько времени вы обычно тратите на подготовку и преобразование данных?» — спрашивает курс Google 2022 года по основам машинного обучения (ML). Предлагаются два варианта: «Меньше половины времени проекта» или «Больше половины времени проекта». Если бы вы догадались о последнем, вы были бы правы; Google заявляет, что на форматирование данных уходит более 80 процентов времени проекта, и это даже без учета времени, необходимого для формулирования проблемы с точки зрения машинного обучения.

«Потребовалось бы много недель усилий, чтобы найти подходящую модель для нашего набора данных, и это действительно непозволительный шаг для многих людей, которые хотят использовать машинное обучение или биологию», — говорит Жаклин Валери, аспирантка пятого курса. биологической инженерии в лаборатории Коллинза, который является первым соавтором статьи.

BioAutoMATED — это автоматизированная система машинного обучения, которая может выбирать и строить подходящую модель для заданного набора данных и даже выполнять трудоемкую задачу предварительной обработки данных, сокращая многомесячный процесс до нескольких часов. Системы автоматизированного машинного обучения (AutoML) все еще находятся в относительно зарождающейся стадии развития, при этом текущее использование в основном сосредоточено на распознавании изображений и текста, но в значительной степени не используется в подобластях биологии, отмечает первый соавтор и постдоктор клиники Jameel Луис Соенксен. 20.

«Фундаментальный язык биологии основан на последовательностях», — объясняет Соенксен, получивший докторскую степень на факультете машиностроения Массачусетского технологического института. «Биологические последовательности, такие как ДНК, РНК, белки и гликаны, обладают удивительным информационным свойством быть изначально стандартизированными, как алфавит. Для текста разработано множество инструментов AutoML, поэтому имело смысл расширить его на [biological] последовательности».

Более того, большинство инструментов AutoML могут исследовать и строить только уменьшенные типы моделей. «Но вы не можете точно знать с самого начала проекта, какая модель лучше всего подойдет для вашего набора данных», — говорит Валери. «Объединяя несколько инструментов в один зонтичный инструмент, мы действительно предоставляем гораздо большее пространство для поиска, чем любой отдельный инструмент AutoML, который может быть достигнут сам по себе».

Репертуар BioAutoMATED моделей машинного обучения с учителем включает три типа: модели бинарной классификации (деление данных на два класса), модели мультиклассовой классификации (деление данных на несколько классов) и регрессионные модели (подгонка непрерывных числовых значений или измерение силы ключевых взаимосвязей между переменные). BioAutoMATED даже может помочь определить, сколько данных требуется для надлежащего обучения выбранной модели.

«Наш инструмент исследует модели, которые лучше подходят для небольших и разреженных наборов биологических данных, а также для более сложных нейронных сетей», — говорит Валери. Это преимущество для исследовательских групп с новыми данными, которые могут подходить или не подходить для задачи машинного обучения. .

«Проведение новых и успешных экспериментов на стыке биологии и машинного обучения может стоить больших денег, — объясняет Соенксен. посмотреть, готовы ли их идеи воплотиться в жизнь. Мы хотим снизить эти барьеры для специалистов в области биологии». С BioAutoMATED исследователи могут свободно проводить первоначальные эксперименты, чтобы оценить, стоит ли нанимать эксперта по машинному обучению для создания другой модели для дальнейших экспериментов.

Открытый исходный код общедоступен, и, как подчеркивают исследователи, его легко запустить. «Нам бы хотелось, чтобы люди брали наш код, улучшали его и сотрудничали с более крупными сообществами, чтобы сделать его инструментом для всех», — говорит Соенксен. «Мы хотим вдохновить сообщество биологических исследователей и привлечь внимание к методам AutoML как к действительно полезному пути, который может объединить строгую биологическую практику с быстро развивающейся практикой AI-ML лучше, чем это достигается сегодня».

Коллинз, старший автор статьи, также связан с Институтом медицинской инженерии и науки Массачусетского технологического института, Программой медицинских наук и технологий Гарварда и Массачусетского технологического института, Институтом Броуда Массачусетского технологического института и Гарварда, а также Институтом Висса. Дополнительные авторы статьи из Массачусетского технологического института включают Кэтрин М. Коллинз ’21; Николаас М. Анженент-Мари, доктор философии ’21; Феликс Вонг, бывший постдоктор кафедры биологической инженерии IMES и Института Броуда; и Тимоти К. Лу, профессор биологической инженерии, электротехники и информатики.

Эта работа была частично поддержана грантом Агентства по уменьшению угрозы обороны, программой SD2 Агентства оборонных исследовательских проектов, группой Пола Г. Аллена Frontiers, Институтом биологически вдохновленной инженерии Висса Гарвардского университета; стипендия MIT-Takeda, стипендия Siebel Foundation, грант CONACyT, стипендия MIT-TATA Center, стипендия Johnson & Johnson для студентов бакалавриата, стипендия Барри Голдуотера, стипендия Маршалла, Cambridge Trust и Национальный институт аллергии и инфекционных заболеваний. Болезни Национального института здоровья. Эта работа является частью проекта «Антибиотики-ИИ», который поддерживается Audacious Project, Flu Lab, LLC, Фондом морского винограда, Розамунд Цандер и Хансйорг Висс для Фонда Висс, а также анонимным донором.

Последние статьи

Related articles

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

hentai lou nicehentai.com ahegeo hentai pron v bigztube.mobi kannada school girl sex videos sxsi com pornoko.net indian porn xnxx.com سكس.جماعي pornigh.com سكس لوسي bangali sex in kompoz2.com ganapa kannada movie songs
سكس مع المعلمة matureporni.com سكس كس مفتوح desi clip.com foxporns.info girls sexy pictures хентай манга hentaitale.net hentai zombie girl little sister doujin justhentaiporn.com kasumi tendo hentai افلام جيانا مايكلز gratisfucktube.com foto sex
desi gay porn vedio momyporn.mobi nepali x video مدام شرموطه freetube18x.com ايناس الدغيدي سكس tony tony chopper hentai hentaimangaz.com naruto new hentai manga الكس والزبر pornarabic.net احلى بزاز ميلفاية arabgrid.net فلم\سكس