EuroCropsML:首個面向少樣本時間序列作物分類的多國基準數據集

2025-04-15,由慕尼黑工業大學等機構創建的 EuroCropsML 數據集,這是一個結合了農民報告的作物數據與 Sentinel-2 衛星觀測的時間序列數據集,覆蓋了愛沙尼亞、拉脫維亞和葡萄牙。該數據集為解決遙感應用中作物類型數據空間不平衡問題提供了新的基準,有助于推動少樣本學習和遷移學習算法在真實世界作物分類任務中的應用和評估。

一、研究背景

衛星遙感技術在農業領域發揮著重要作用,如作物類型分類、產量預測等。然而,不同地理區域的作物類型數據分布極不均衡,這種數據空間不平衡問題給準確的作物分類帶來了挑戰。為了克服這一問題,遷移學習和元學習算法應運而生,但它們在真實世界復雜應用中的表現尚待深入評估。

目前遇到困難和挑戰:

1、數據空間不平衡:不同地區作物數據的豐富程度差異巨大,導致在數據匱乏地區難以直接應用基于數據豐富地區訓練的模型。

2、算法泛化能力不足:現有的遷移學習和元學習算法在不同地理區域之間的知識遷移效果不佳,難以適應新地區的作物分類任務。

3、計算資源與性能的權衡:提高模型性能往往需要更多的計算資源和更長的訓練時間,這在實際應用中可能會受到限制。

數據集地址:EuroCropsML|農業數據分析數據集|遙感技術數據集

二、讓我們一起看一下EuroCropsML

EuroCropsML 是一個結合了農民報告的作物數據與 Sentinel-2 衛星觀測的時間序列數據集,專為少樣本作物類型分類任務設計。

該數據集基于 EuroCrops 參考數據,擴展了 Sentinel-2 L1C 反射率數據,覆蓋了愛沙尼亞、拉脫維亞和葡萄牙的農業區域。為了減少數據不平衡問題,對某些頻繁出現的作物類型(如牧草)進行了重采樣。此外,還對數據進行了預處理,包括去除云層干擾和標準化等操作。

數據集包含 706,683 個具有多類標簽的數據點,涉及 176 種不同的作物類型,其中 35 種在三個國家都有分布。每個數據點包含一年內無云的多光譜 Sentinel-2 觀測數據的時間序列,時間步長多達 216 個。

數據集特點:

1、多國覆蓋:包含來自愛沙尼亞、拉脫維亞和葡萄牙的農業數據,具有不同的氣候條件和農業實踐。

2、多類標簽:涵蓋了 176 種不同的作物類型,提供了豐富的分類任務。

3、時間序列數據:每個數據點包含一年內的多光譜 Sentinel-2 觀測數據,能夠反映作物的生長周期。

基準測試:

在基準測試中,MAML 類算法(如 MAML 和 ANIL)在少樣本學習任務中表現最佳,其中 ANIL 在 500-shot 任務中達到了 65.2% 的分類準確率和 0.556 的 Cohen’s Kappa 系數,分別比無預訓練提升了 2.0% 和 2.7%,顯示出顯著的性能提升,但這些算法的訓練時間比傳統方法長了 3-5 倍。

源區域和目標區域(使用 EuroCrops HCAT3 第 3 級(Schneider 等人,2023a,b))的農田可視化。初始訓練在源區域的 Sentinel-2 L1C 農業時間序列上進行,隨后在獨立的目標區域對模型進行微調和評估。

目前,在歐盟27個成員國中,有17個國家的數據在EuroCrops數據集中實現了協調,而有四個國家僅提供了部分數據。數據的可用性指的是EuroCrops數據集的第10版。

根據農業參考數據的可用性對歐盟成員國進行排序。這指的是EuroCrops數據集的第10版

在三個感興趣區域(ROI):愛沙尼亞、拉脫維亞和葡萄牙之間共享和獨特的標注作物類別的數量。

構成EuroCropsML數據集的三個國家的數據點數量和不同的作物類別數量。數據點的數量指的是經過預處理后獨特地塊的數量

上部直方圖顯示了在預訓練和微調數據集中,不同豐度(地塊數量)的作物類別數量的分布情況。下部直方圖則專注于愛沙尼亞的微調數據,展示了在預訓練階段是否見過的作物類別數量分布,這些數據僅來自拉脫維亞或拉脫維亞和葡萄牙。兩個直方圖均使用對數刻度。

用于采樣元學習任務的拉脫維亞(左)和葡萄牙(右)的NUTS區域

三、展望EuroCropsML應用

案例:作物分類在農業管理中的應用

以前,農民們要想知道地里種的是啥作物,主要靠自己去田里看看,或者請專家來實地考察。這種方法不僅費時費力,還只能覆蓋一小塊地。要是地多了,根本忙不過來。而且,靠人眼識別,難免會出錯,導致分類不準確。比如,有些作物長得差不多,很容易混淆。

另外,雖然衛星圖像也能幫忙,但以前的衛星圖像分析方法需要很多標注好的數據來訓練模型。可問題是,不同地方的數據分布不一樣,有些地方數據多,有些地方數據少,這就導致模型在數據少的地方表現不好,分類精度差。

現在,有了 EuroCropsML 數據集,農場可以這樣操作:

1、數據預處理:用數據集里的衛星圖像和農民報告的作物數據,先對農場的作物進行預訓練。

2、模型訓練:選一個好用的算法,比如 MAML 或 ANIL,在預訓練的基礎上稍微調整一下,就能適應農場的具體情況。

3、實時監測:把訓練好的模型用起來,實時監測作物的生長情況,發現問題及時調整。

4、精準決策:根據分類結果,農民可以更科學地安排種植,選擇合適的作物品種,優化灌溉和施肥計劃。

這樣一來,農場不僅分類更準了,還省了不少事兒,產量也提高了,實現了精準農業。

更多免費的數據集,請打開:遇見數據集

遇見數據集-讓每個數據集都被發現,讓每一次遇見都有價值。遇見數據集,領先的千萬級數據集搜索引擎,實時追蹤全球數據集,助力把握數據要素市場。https://www.selectdataset.com/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/901802.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/901802.shtml
英文地址,請注明出處:http://en.pswp.cn/news/901802.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

將python項目打包成Windows后臺服務

前文,我開發了一個基于windows11與本地deepseek實現的語音助手,之前是通過CMD直接執行項目的main.py文件。但是這樣不適合移植,現在想將其生成一個exe文件,以及部署成windows的后臺服務。 關于語音助手的開發與發布,可以看的CSDN文章:一個基于windows11與本地deepseek實…

yolov8復現

Yolov8的復現流程主要包含環境配置、下載源碼和驗證環境三大步驟: 環境配置 查看電腦狀況:通過任務管理器查看電腦是否有獨立顯卡(NVIDIA卡)。若有,后續可安裝GPU版本的pytorch以加速訓練;若沒有&#xff0…

Yocto項目實戰教程 · 第4章:4.1小節元數據

🔍 B站相應的視頻教程: 📌 Yocto項目實戰教程-第4章-4.1小節-元數據 記得三連,標為原始粉絲。 在嵌入式Linux系統構建中,Yocto項目憑借其高度模塊化、可配置的特性成為主流工具。而其背后的關鍵支撐之一,便…

《AI大模型應知應會100篇》第23篇:角色扮演技巧:讓AI成為你需要的專家

第23篇:角色扮演技巧:讓AI成為你需要的專家 摘要 在當今人工智能快速發展的時代,大模型已經不僅僅是簡單的問答工具,它們可以通過角色扮演技巧模擬各類專家身份,從而為用戶提供更專業、更有針對性的服務。本文將深入探…

Windows系統安裝RustDesk Server的詳細步驟和客戶端設置

Windows系統安裝RustDesk Server的詳細步驟 在Windows系統上安裝RustDesk Server涉及幾個關鍵步驟,包括安裝必要的依賴、下載RustDesk Server程序、配置并啟動服務。以下是詳細的步驟: 1. 安裝Node.js和PM2 RustDesk Server的某些版本可能需要Node.js環境來運行,而PM2是一…

如何實現一個構造函數繼承另一個構造函數的屬性和方法?給出ES5和ES6兩種方式

在 JavaScript 中,構造函數繼承可以通過 原型鏈 和 構造函數調用 實現。以下是 ES5 和 ES6 的實現方式: ES5 實現方式 關鍵步驟 繼承實例屬性:在子構造函數中調用父構造函數的 call/apply,綁定 this。繼承原型方法:將…

AWS Redshift的使用場景及一些常見問題

Redshift 不是關系型數據庫, 提供了Amazon Redshift Serverless 和 Amazon Redshift 都是構建于 Redshift 數倉引擎之上的,但它們適用的場景不同。Redshift和Dynamodb都可以存儲數據, 分別怎么選擇? 這里記錄一些常見的問題和場景。 1. 如何選擇用Amazon Redshift…

十五種光電器件綜合對比——《器件手冊--光電器件》

十五、光電器件 名稱 原理 特點 應用 發光二極管(LED) 基于半導體材料的電致發光效應,當電流通過時,電子與空穴復合,釋放出光子。 高效、節能、壽命長、響應速度快、體積小。 廣泛用于指示燈、照明、顯示&#…

Electricity Market Optimization(VI) - 機組組合模型以及 Gurobi 求解

本文參考鏈接:link \hspace{1.6em} 機組組合問題在電力系統中非常重要,這個問題也是一個優化問題,研究的就是如何調度現有的機組,調度的對象是以煤炭、石油、天然氣為燃料的火力發電機以及水力發電機等可預測處理的發電機組&#…

linux多線(進)程編程——(8)多進程的沖突問題

前言 隨著時間的推移,共享內存已經在修真界已經淪為禁術。因為使用這種方式溝通的兩人往往會陷入到走火入魔的狀態,思維扭曲。進程君父子見到這種情況,連忙開始專研起來,終于它們發現了共享內存存在的問題: 進程間沖…

網絡層IP協議知識大梳理

全是通俗易懂的講解,如果你本節之前的知識都掌握清楚,那就速速來看我的IP協議筆記吧~ 自己寫自己的八股!讓未來的自己看懂! (全文手敲,受益良多) 網路基礎3 網路層 TCP并沒有把數據發到網路…

數據結構與算法學習導航

目錄 指導思想資料總結代碼隨想錄hello-algoOI-WIKI 一名麻瓜的刷leetcode的簡單概述。 在這里對過去的自己說: 如果你相信算法有用你就刷刷leetcode,如果不相信面試會讓你相信。 當然,現在我確實認為算法和數據結構有用,leetcode也有用。 …

【網絡安全】誰入侵了我的調制解調器?(二)

文章目錄 針對 TR-069 協議 REST API 的攻擊思路攻擊百萬臺調制解調器意外發現 Cox 后端 API 的授權繞過漏洞確認我們能夠進入任何人的設備訪問和更新任何Cox商業客戶賬戶通過泄露的加密密鑰覆蓋任何人的設備設置執行對任何調制解調器的命令影響最后想說閱讀本文前,請先行瀏覽…

大模型在急性單純性闌尾炎預測及治療方案制定中的應用研究

目錄 一、引言 1.1 研究背景與意義 1.2 研究目的 1.3 研究方法與創新點 二、急性單純性闌尾炎概述 2.1 定義與發病機制 2.2 臨床表現 2.3 傳統診斷方法 三、大模型在急性單純性闌尾炎預測中的應用 3.1 大模型簡介 3.2 數據收集與處理 3.3 模型訓練與優化 3.4 預測…

Linux 上安裝和配置 VNC 遠程桌面

在 Linux 上安裝和配置 VNC(Virtual Network Computing)可以讓你遠程訪問圖形化桌面環境。以下是詳細的安裝和配置步驟,適用于主流 Linux 發行版(如 Ubuntu、CentOS、Debian 等)。 1. 安裝 VNC 服務器 Ubuntu/Debian …

《AI大模型應知應會100篇》第22篇:系統提示詞(System Prompt)設計與優化

第22篇:系統提示詞(System Prompt)設計與優化 摘要 在大語言模型(LLM)應用中,系統提示詞(System Prompt)是控制模型行為的核心工具之一。它不僅定義了模型的身份、角色和行為規范,還直接影響輸…

其他網頁正常進入,但是CSDN進入之后排版混亂

顯示不正常,排版混亂 解決方法: ①打開網絡設置 ②更改適配器 ③所連接的網絡 --右鍵 屬性 然后就可以正常訪問了。

Qwen2.5-VL視覺大語言模型復現過程,沒碰到什么坑

視頻講解:Qwen2.5-VL視覺大語言模型復現過程,沒碰到什么坑_嗶哩嗶哩_bilibili Qwen2.5-VL視覺大語言模型復現過程,沒碰到什么坑 今天復現下Qwen2.5-VL玩玩 https://github.com/QwenLM/Qwen2.5-VL 創建conda環境,實測22.04&#x…

宮庭海:跨界融合與家國情懷的影視開拓者

從音樂經紀人到影視多面手的創業之路 近日,國內娛樂產業領軍人物、著名音樂經紀人、制片人、影視投資人宮庭海先生再次受到廣泛關注。憑借其卓越的成就和貢獻,宮庭海先生在業界樹立了良好的口碑和廣泛的影響力。 宮庭海, 遼寧省大連市人&…

LeetCode算法題(Go語言實現)_51

題目 給你兩個下標從 0 開始的整數數組 nums1 和 nums2 ,兩者長度都是 n ,再給你一個正整數 k 。你必須從 nums1 中選一個長度為 k 的 子序列 對應的下標。 對于選擇的下標 i0 ,i1 ,…, ik - 1 ,你的 分數 …