Тамара Бродерик впервые ступила на территорию кампуса Массачусетского технологического института, когда была ученицей старшей школы, в качестве участницы первой программы женских технологий. Месячный летний академический опыт дает молодым женщинам практическое введение в инженерное дело и информатику.
Какова вероятность того, что она вернется в Массачусетский технологический институт спустя годы, на этот раз в качестве преподавателя?
На этот вопрос Бродерик, вероятно, мог бы ответить количественно, используя байесовский вывод, статистический подход к вероятности, который пытается количественно оценить неопределенность путем постоянного обновления предположений по мере получения новых данных.
В своей лаборатории в Массачусетском технологическом институте новый доцент кафедры электротехники и информатики (EECS) использует байесовский вывод для количественной оценки неопределенности и измерения надежности методов анализа данных.
«Мне всегда было интересно понять не просто вопрос «Что мы знаем из анализа данных», но и вопрос «Насколько хорошо мы это знаем?», — говорит Бродерик, который также является сотрудником Лаборатории систем информации и принятия решений и Институт данных, систем и общества. «Реальность такова, что мы живем в шумном мире и не всегда можем получить именно те данные, которые нам нужны. Как нам учиться на данных, но в то же время осознавать, что существуют ограничения, и правильно с ними справляться?»
В целом ее цель – помочь людям понять ограничения доступных им статистических инструментов, а иногда и работать с ними над созданием более эффективных инструментов для конкретной ситуации.
Например, ее группа недавно сотрудничала с океанографами для разработки модели машинного обучения, которая сможет делать более точные прогнозы океанских течений. В другом проекте она и другие работали со специалистами по дегенеративным заболеваниям над инструментом, который помогает людям с тяжелыми двигательными нарушениями использовать графический пользовательский интерфейс компьютера, манипулируя одним переключателем.
Общей нитью, проходящей через всю ее работу, является упор на сотрудничество.
«Работая в сфере анализа данных, вы, так сказать, зависаете у каждого на заднем дворе. Вам действительно не будет скучно, потому что вы всегда можете изучать какую-то другую область и думать о том, как мы можем применить там машинное обучение», — говорит она.
Времяпровождение во многих академических «задних дворах» особенно привлекает Бродерик, которая даже с юных лет изо всех сил пыталась сузить свои интересы.
Математическое мышление
Выросшая в пригороде Кливленда, штат Огайо, Бродерик интересовалась математикой, сколько себя помнит. Она вспоминает, как была очарована идеей о том, что произойдет, если продолжать прибавлять число само к себе, начиная с 1+1=2, а затем 2+2=4.
«Мне было около пяти лет, поэтому я не знал, что такое «степень двойки» или что-то в этом роде. Я просто очень увлекалась математикой», — говорит она.
Ее отец заметил ее интерес к этому предмету и записал ее в программу Университета Джонса Хопкинса под названием «Центр талантливой молодежи», которая дала Бродерик возможность посещать трехнедельные летние занятия по ряду предметов, от астрономии до теории чисел и информатики.
Позже, в старшей школе, она проводила астрофизические исследования вместе с постдоком в Университете Кейс Вестерн. Летом 2002 года она провела четыре недели в Массачусетском технологическом институте в качестве участницы первого класса Программы женских технологий.
Ей особенно понравилась свобода, которую предлагает программа, и ее направленность на использование интуиции и изобретательности для достижения целей высокого уровня. Например, группе было поручено создать устройство из LEGO, которое они могли бы использовать для биопсии винограда, взвешенного в желе.
Программа показала ей, как много творческих способностей связано с инженерией и информатикой, и пробудила в ней интерес к академической карьере.
«Но когда я поступил в колледж в Принстоне, я не мог решить — математика, физика, информатика — все они казались мне супер-крутыми. Я хотела сделать все это», — говорит она.
Она решила получить степень бакалавра математики, но посещала все курсы физики и информатики, которые могла втиснуть в свое расписание.
Углубляемся в анализ данных
Получив стипендию Маршалла, Бродерик провел два года в Кембриджском университете в Соединенном Королевстве, получив степень магистра углубленных исследований по математике и степень магистра философии по физике.
В Великобритании она прошла ряд занятий по статистике и анализу данных, в том числе свой первый курс по байесовскому анализу данных в области машинного обучения.
Она вспоминает, что это был преобразующий опыт.
«Во время моего пребывания в Великобритании я поняла, что мне очень нравится решать реальные проблемы, которые важны для людей, и что байесовский вывод используется в некоторых из наиболее важных проблем», — говорит она.
Вернувшись в США, Бродерик направилась в Калифорнийский университет в Беркли, где в качестве аспиранта присоединилась к лаборатории профессора Майкла И. Джордана. Она получила докторскую степень по статистике со специализацией на байесовском анализе данных.
Она решила продолжить карьеру в академических кругах, и в Массачусетский технологический институт ее привлек совместный характер кафедры EECS, а также энтузиазм и дружелюбие ее потенциальных коллег.
Ее первые впечатления оправдались, и Бродерик говорит, что нашла в Массачусетском технологическом институте сообщество, которое помогает ей проявлять творческий подход и исследовать сложные и эффективные проблемы с помощью широкого спектра приложений.
«Мне посчастливилось работать в моей лаборатории с действительно удивительной группой студентов и постдоков — блестящих и трудолюбивых людей, чьи сердца находятся в правильном месте», — говорит она.
Один из недавних проектов ее команды предполагает сотрудничество с экономистом, который изучает использование микрокредитования или кредитования небольших сумм денег по очень низким процентным ставкам в бедных регионах.
Цель программ микрокредитования – вывести людей из бедности. Экономисты проводят рандомизированные контрольные исследования в деревнях региона, которые получают или не получают микрокредиты. Они хотят обобщить результаты исследования, предсказав ожидаемый результат, если применить микрокредитование к другим деревням за пределами их исследования.
Но Бродерик и ее коллеги обнаружили, что результаты некоторых исследований микрокредитования могут быть очень хрупкими. Удаление одной или нескольких точек данных из набора данных может полностью изменить результаты. Одна из проблем заключается в том, что исследователи часто используют эмпирические средние значения, где несколько очень высоких или низких значений данных могут исказить результаты.
Используя машинное обучение, она и ее коллеги разработали метод, который может определить, сколько точек данных необходимо отбросить, чтобы изменить существенный вывод исследования. С помощью этого инструмента учёный может увидеть, насколько хрупкими являются результаты.
«Иногда удаление очень небольшой части данных может изменить основные результаты анализа данных, и тогда мы можем беспокоиться о том, насколько эти выводы распространяются на новые сценарии. Есть ли способы сообщить об этом людям? Это то, чего мы добиваемся в этой работе», — объясняет она.
В то же время она продолжает сотрудничать с исследователями в различных областях, таких как генетика, чтобы понять плюсы и минусы различных методов машинного обучения и других инструментов анализа данных.
Счастливые маршруты
Исследования — это то, что движет Бродерик как исследователя, а также подпитывает одно из ее увлечений за пределами лаборатории. Ей и ее мужу нравится собирать патчи, которые они зарабатывают, путешествуя по всем тропам парка или системы троп.
«Я думаю, что мое хобби действительно сочетает в себе интересы пребывания на природе и работы с электронными таблицами», — говорит она. «С этими пешеходными маршрутами вам придется исследовать все, а затем вы увидите области, которые обычно не видите. В этом смысле это авантюра».
Они открыли для себя несколько удивительных походов, о которых никогда бы не узнали, но также предприняли немало «походов-катастроф», говорит она. Но каждый поход, будь то скрытый драгоценный камень или заросший беспорядок, предлагает свои награды.
И, как и в ее исследованиях, любопытство, непредвзятость и страсть к решению проблем никогда не сбивали ее с пути.