Карты посевов помогают ученым и политикам отслеживать глобальные запасы продовольствия и оценивать, как они могут измениться в связи с изменением климата и ростом населения. Но для получения точных карт типов культур, которые выращиваются от фермы к ферме, часто требуются исследования на местах, на содержание которых есть ресурсы лишь у нескольких стран.
Теперь инженеры MIT разработали метод быстрой и точной маркировки и картирования типов сельскохозяйственных культур, не требуя личной оценки каждой отдельной фермы. Метод команды использует комбинацию изображений Google Street View, машинного обучения и спутниковых данных для автоматического определения культур, выращиваемых по всему региону, от одной доли акра до другой.
Исследователи использовали эту технику для автоматического создания первой общенациональной карты сельскохозяйственных культур Таиланда — страны с мелкими землевладениями, где небольшие независимые фермы составляют преобладающую форму сельского хозяйства. Команда создала карту четырех основных сельскохозяйственных культур Таиланда — риса, маниоки, сахарного тростника и кукурузы — и определила, какой из четырех видов выращивается через каждые 10 метров и без промежутков по всей стране. Полученная карта достигла точности 93 процентов, что, по словам исследователей, сопоставимо с усилиями по картографированию на местах в странах с высоким уровнем дохода и крупными фермерскими хозяйствами.
Команда применяет свою технику картирования в других странах, таких как Индия, где небольшие фермы обеспечивают питание большей части населения, но тип сельскохозяйственных культур, выращиваемых от фермы к ферме, исторически плохо регистрировался.
«Это давний пробел в знаниях о том, что выращивается во всем мире», — говорит Шерри Ванг, доцент д’Арбелоффа по развитию карьеры на факультете машиностроения Массачусетского технологического института и Института данных, систем и общества (IDSS). «Конечная цель — понять результаты сельского хозяйства, такие как урожайность, и то, как вести более устойчивое сельское хозяйство. Одним из ключевых предварительных шагов является составление карты того, что вообще выращивается: чем более детально вы сможете составить карту, тем на больше вопросов вы сможете ответить».
Ван вместе с аспирантом Массачусетского технологического института Хорди Лагуартой Солером и Томасом Фриделем из агротехнической компании PEAT GmbH представят документ с подробным описанием своего метода картирования позднее в этом месяце на конференции AAAI по искусственному интеллекту.
Основная истина
Мелкие фермы часто управляются одной семьей или фермером, которые живут за счет выращиваемых ими сельскохозяйственных культур и домашнего скота. По оценкам, мелкие фермы поддерживают две трети сельского населения мира и производят 80 процентов продуктов питания в мире. Отслеживание того, что и где выращивается, важно для отслеживания и прогнозирования поставок продовольствия по всему миру. Но большинство этих мелких ферм находятся в странах с низким и средним уровнем дохода, где мало ресурсов выделяется на отслеживание типов сельскохозяйственных культур и урожайности отдельных ферм.
Усилия по картированию посевов в основном проводятся в регионах с высоким уровнем дохода, таких как Соединенные Штаты и Европа, где государственные сельскохозяйственные агентства контролируют обследования посевов и отправляют оценщиков на фермы для маркировки культур с поля на поле. Эти «наземные метки» затем передаются в модели машинного обучения, которые устанавливают связь между наземными метками реальных культур и спутниковыми сигналами тех же полей. Затем они маркируют и наносят на карту более широкие участки сельскохозяйственных угодий, которые не охватывают оценщики, но которые автоматически делают спутники.
«Чего не хватает странам с низким и средним уровнем дохода, так это наземной маркировки, которую мы можем ассоциировать со спутниковыми сигналами», — говорит Лагуарта Солер. «В большинстве стран мира получение этих основных истин для обучения модели было ограничено».
Команда поняла, что, хотя многие развивающиеся страны не имеют ресурсов для проведения обследований посевов, они потенциально могли бы использовать другой источник наземных данных: изображения придорожных дорог, полученные с помощью таких сервисов, как Google Street View и Mapillary, которые отправляют автомобили по всему региону, чтобы Делайте непрерывные снимки в формате 360 градусов с помощью видеорегистраторов и камер на крыше.
В последние годы такие услуги стали доступны странам с низким и средним уровнем дохода. Хотя целью этих сервисов не является конкретно получение изображений посевов, команда MIT увидела, что они могут искать изображения на обочинах дорог для идентификации посевов.
Обрезанное изображение
В своем новом исследовании исследователи работали с изображениями Google Street View (GSV), сделанными по всему Таиланду — стране, которую сервис недавно довольно тщательно сфотографировал и которая состоит преимущественно из мелких ферм.
Начав с более чем 200 000 изображений GSV, случайно выбранных по всему Таиланду, команда отфильтровала изображения, на которых были изображены здания, деревья и общая растительность. Около 81 000 изображений были связаны с культурой. Они отложили 2000 штук и отправили их агроному, который на глаз определил и промаркировал каждый тип культуры. Затем они обучили сверточную нейронную сеть автоматически генерировать метки культур для остальных 79 000 изображений, используя различные методы обучения, в том числе iNaturalist — краудсорсинговую веб-базу данных о биоразнообразии и GPT-4V — «мультимодальную модель большого языка», которая позволяет пользователю ввести изображение и попросить модель определить, что на нем изображено. Для каждого из 81 000 изображений модель создала метку одной из четырех культур, которые, вероятно, были изображены на изображении — риса, кукурузы, сахарного тростника или маниоки.
Затем исследователи сопоставили каждое помеченное изображение с соответствующими спутниковыми данными, полученными в том же месте в течение одного вегетационного сезона. Эти спутниковые данные включают измерения на разных длинах волн, такие как зелень местности и ее отражательная способность (которая может быть признаком воды).
«Каждый тип культуры имеет определенную характеристику в этих разных диапазонах, которая меняется в течение вегетационного периода», — отмечает Лагуарта Солер.
Команда обучила вторую модель устанавливать связи между спутниковыми данными о местоположении и соответствующей меткой урожая. Затем они использовали эту модель для обработки спутниковых данных, полученных по остальной части страны, где этикетки сельскохозяйственных культур не были созданы или доступны. На основании ассоциаций, изученных моделью, она затем присвоила названия культур по всему Таиланду, создав карту типов культур по всей стране с разрешением 10 квадратных метров.
Эта первая в своем роде карта урожая включала в себя места, соответствующие 2000 изображениям GSV, которые первоначально выделили исследователи и которые были помечены арбористами. Эти помеченные человеком изображения использовались для проверки подписей на карте, и когда команда проверила, соответствуют ли подписи на карте экспертным меткам «золотого стандарта», она сделала это в 93 процентах случаев.
«В США мы также ожидаем точность более 90 процентов, тогда как в предыдущей работе в Индии мы увидели только 75 процентов, потому что количество меток на земле ограничено», — говорит Ван. «Теперь мы можем создавать эти этикетки дешевым и автоматизированным способом».
Исследователи собираются составить карту посевов по всей Индии, где недавно стали доступны изображения придорожных дорог с помощью Google Street View и других сервисов.
«В Индии более 150 миллионов мелких фермеров», — говорит Ван. «Индия покрыта сельским хозяйством, почти сплошными фермами, но очень маленькими, и исторически было очень сложно создавать карты Индии, потому что там очень мало надписей на земле».
Команда работает над созданием карт посевов в Индии, которые можно было бы использовать для обоснования политики, связанной с оценкой и повышением урожайности в условиях роста глобальной температуры и численности населения.
«Было бы интересно создавать эти карты с течением времени», — говорит Ван. «Тогда вы сможете начать видеть тенденции, и мы сможем попытаться связать эти вещи с чем-то вроде изменений климата и политики».