Борщевик не спрячется

Как нейросеть спасает заповедники от зеленого монстра

ML-разработчики из Школы анализа данных вместе с экспертами Центра технологий для общества «Яндекса» и движением «СтопБорщевик» запустили ИИ-сервис для выявления на спутниковых фото зарослей борщевика Сосновского. Инструментом могут бесплатно воспользоваться все желающие: от природоохранных организаций и национальных парков до ученых и фермеров. Разметка снимков с помощью сервиса занимает в среднем в 50 раз меньше времени, чем вручную.

Фото: Петр Кассин, Коммерсантъ

Фото: Петр Кассин, Коммерсантъ

Сервис уже протестировали волонтеры из «СтопБорщевика» и Центра содействия экспедиционной деятельности. С его помощью они выявили очаги заражения общей площадью 421 га в 17 регионах европейской части страны, при этом территорию Москвы и Московской области проанализировали полностью. На основе полученных данных волонтеры проводят работы по уничтожению борщевика — в основном это выкапывание растений и обрезка соцветий. Работы ведутся в первую очередь на особо охраняемых природных территориях. Например, команда «СтопБорщевика» благодаря сервису отыскала и ликвидировала крупный очаг заражения в национальном парке «Плещеево озеро» в Ярославской области.

Сервис могут использовать не только волонтеры — он доступен всем желающим. На размеченных территориях данные об очагах заражения борщевиком можно посмотреть на карте. Если разметки пока нет, достаточно загрузить на сервис спутниковые снимки нужной местности в GeoTIFF — этот формат содержит метаданные для привязки изображения к карте. Алгоритм проанализирует изображения и выделит зоны произрастания борщевика.

За выявление борщевика на спутниковых фото отвечают разработанные в «Яндексе» технологии компьютерного зрения. Модель обучали в сервисах Yandex Cloud, для валидации использовался датасет из 10 тыс. спутниковых фото с очагами заражения. На первом этапе качество распознавания оценивали по метрике IoU (Intersection over Union), которая определяет точность детекции. Затем алгоритм размечал новые снимки, а результаты оценивали эксперты «СтопБорщевика».

В 2026 году волонтеры продолжат работу: будут добавлять другие регионы и актуализировать уже имеющиеся данные. К лету планируется задействовать сервис для мониторинга территории общей площадью 100 тыс. кв. км в Тверской и Ярославской областях. Кроме того, с его помощью движение «СтопБорщевик» при поддержке Росзаповедцентра Минприроды России и Центра содействия экспедиционной деятельности разработает карты зараженности для особо охраняемых природных территорий федерального значения.

«Яндекс» намерен масштабировать сервис, обучив его отслеживать и другие инвазивные растения, например эхиноцистис лопастный и два вида золотарников (канадский и гигантский). Также в планах создание единой карты очагов заражения борщевиком на основе уже собранных данных.


На вопросы «Ъ-Науки» ответила Марина Шайкина, руководитель картографических проектов движения «СтопБорщевик»:

— Как устроена работа нейросети?

— Данные для обучения ML-модели готовили вручную. Эксперты движения «СтопБорщевик» анализировали спутниковые снимки и отмечали на них заросли борщевика. Так был собран датасет из 10 тыс. размеченных фрагментов снимков из Московской и Ленинградской областей, Республики Коми и Татарстана. На этих данных ML-инженеры Школы анализа данных «Яндекса» обучили нейросетевую модель в сервисах Yandex Cloud. Качество распознавания оценивали по метрике IoU (Intersection over Union). Затем модель начала размечать новые снимки, а эксперты «СтопБорщевика» проверяли результаты — так модель постепенно улучшалась.

С помощью сервиса волонтеры из «СтопБорщевика» и Центра содействия экспедиционной деятельности уже выявили очаги заражения общей площадью 421 га в 17 регионах европейской части страны, при этом территорию Москвы и Московской области проанализировали полностью. Готовую разметку по этим территориям можно посмотреть на сайте.

Чтобы найти очаги заражения в других регионах, достаточно загрузить на сайте спутниковые снимки нужной местности в формате GeoTIFF — это исходный формат спутниковых данных с метаданными, который позволяет корректно анализировать территорию. Снимки в этом формате можно найти на общедоступных платформах. Алгоритм машинного обучения обрабатывает снимок, распознает заросли борщевика Сосновского и выделяет их.

Борщевик Сосновского хорошо заметен из космоса в период цветения: в июне и июле его скопления выглядят как крупные салатовые или ярко-зеленые пятна на фоне более темной зелени. Именно по этому визуальному признаку модель отличает борщевик от другой растительности. Растение определяется с помощью вегетационного индекса CIVE (англ. Color Index of Vegetation Extraction), для которого подобран порог: если значение выше, алгоритм обнаруживает инвазивный вид, если ниже — нет. На выходе — карта с отмеченными очагами, информация о площади заражения по каждому полигону и возможность скачать результаты в виде изображения или векторного файла с координатами для дальнейшей работы в ГИС-системах.

— Какие уникальные компетенции «Яндекса» позволили решить эту задачу? За счет чего — накопленных данных, архитектуры моделей, инфраструктуры Yandex Cloud, опыта в компьютерном зрении — ваш результат отличается от профильных аграрных и экологических проектов?

— Главное отличие сервиса от существующих автоматизированных систем мониторинга — в его открытости и доступности. Реализация проекта стала возможной благодаря совмещению экологической и ML-экспертизы.

Эксперты организации «СтопБорщевик» занимались разметкой данных для обучения модели и валидацией результатов. На основе полученных данных волонтеры проводят работы по уничтожению борщевика: выкапывают растения и обрезают соцветия.

Студенты Школы анализа данных разработали ИИ-модель. Они использовали инфраструктуру Yandex Cloud для хранения данных и обучения модели. Это позволило собрать и обработать датасет из спутниковых снимков.

— Каким образом нейросеть дифференцирует опасный инвазивный вид (борщевик Сосновского) от внешне похожих зонтичных, включая безвредный борщевик сибирский?

— Борщевик Сосновского как инвазионный вид часто образует крупные, плотные маловидовые заросли (в которых, кроме него, почти нет других растений). Они и видны из космоса (ярко-зеленый цвет на снимке в естественных цветах). Местный борщевик сибирский таких зарослей не образует, обычно он присутствует на открытых пространствах вперемешку с другими луговыми травами, и они все вместе иначе выглядят на снимках (более темный зеленый). Это актуально и для других местных растений из семейства зонтичных (дудника лесного, дягиля и др.).

В период цветения борщевик хорошо заметен на снимках как крупные салатовые или ярко-зеленые пятна на фоне более темной зелени. Именно по этому визуальному признаку модель отличает борщевик от другой растительности.

— С какими техническими и алгоритмическими сложностями столкнулась команда в ходе разработки?

— В процессе обучения модели команда работала с нормализацией данных. Спутниковые снимки часто содержат аномально яркие или темные пиксели. Это могут быть блики, тени, артефакты сжатия. Их устраняли через нормализацию значений яркости. На спутниковых снимках пикселей без борщевика значительно больше. Это искажение может привести к тому, что модель будет всегда помечать пиксель как не содержащий борщевик (даже там, где он есть). Чтобы избежать этого, разработчики применяли инструмент RandomUnderSampler — он берет все объекты миноритарного класса, случайно удаляет часть объектов мажоритарного класса и делает классы примерно одинаковыми по размеру.

— Насколько легко адаптировать существующую модель для обнаружения других инвазивных растений? Что потребуется — дообучение на новом датасете, смена архитектуры или полностью пересборка пайплайна?

— «Яндекс» намерен масштабировать сервис, обучив его отслеживать и другие инвазивные виды, например эхиноцистис лопастный и два вида золотарников (канадский и гигантский). Для этого необходим датасет с размеченными экспертами зарослями конкретных растений.

— Какую практическую ценность сервис представляет для сельхозпроизводителя? Что фермер получает на выходе, как интерпретирует результаты и каким образом они могут быть интегрированы в его хозяйственные процессы?

— Первоначально проект стал ответом на запрос от Росзаповедцентра — создать сервис, который предупреждал бы о появлении борщевика вблизи заповедных территорий. Но такой инструмент нужен не только заповедникам, но и региональным властям, фермерам, дачникам и волонтерам. Поэтому мы сделали его открытым и бесплатным, чтобы он был полезен каждому, кто сталкивается с этой проблемой. На выходе пользователь получает карту с отмеченными очагами борщевика, информацию о площади заражения, возможность скачать результаты в виде векторного файла с координатами для работы в ГИС-системах. Это позволяет находить новые зараженные области, оценивать результаты ликвидации, аккумулировать полученные данные.

Ключевой эффект — в экономии времени: сервис обрабатывает данные примерно в 50 раз быстрее, чем ручная разметка. Также важно, что инструмент не требует специальных навыков и доступен широкому кругу пользователей — от фермеров до ученых.

— Каковы дальнейшие планы команды по развитию сервиса?

— Развитие идет в нескольких направлениях. К лету 2026 года планируется охватить мониторингом до 100 тыс. кв. км в Тверской и Ярославской областях, создать карты зараженности для особо охраняемых природных территорий федерального значения при поддержке Росзаповедцентра. В перспективе — создание единой карты очагов заражения борщевиком на основе уже собранных данных, адаптация под другие инвазивные растения.

Отдельная амбициозная цель — рассчитать общую площадь зараженных борщевиком земель в России. Сегодня такой оценки не существует, и, если сервис позволит ее получить, это станет важным шагом для планирования борьбы на федеральном уровне.

Мария Грибова