神奇動物在哪里,但導演是微軟

3e930e97fba287d37e39139d5418fdc1.png

944cd2661ba835ad0703e5dc46668cfa.png

c6873211587af74d2ecaf430b820289f.png




大數據產業創新服務媒體

——聚焦數據?· 改變商業


一說到計算機視覺,大多數人第一時間聯想到的便是“人臉識別”、“自動駕駛“、道路檢測”等跟我們日常生活息息相關的關鍵詞。而在2024年的5月末,微軟在GitHub上面上傳了這樣一個計算機視覺的項目,完全不包含這些關鍵詞,卻吸引來了無數人圍觀,短短兩天時間就沖到了700顆星。

這個項目就是Pytorch-Wildlife。項目成立的初衷是因為人類活動導致全球生物多樣性急劇下降,對野生動物種群的全面監控變得尤為迫切。

可是想要完全利用人力,來對某一種群或者某一塊棲息地進行24小時監控,這顯然是不現實的。不僅僅是因為成本過于高昂,而是人類肉眼很難完整觀察清楚一些行動迅敏的動物,這就會導致沒有辦法準確記錄物種以及棲息地情況。于是在這個大背景下,Pytorch-Wildlife誕生了。

PyTorch-Wildlife是一個用于創建、修改和共享強大 AI 保護模型的平臺。這些模型可用于各種應用,包括相機陷阱圖像(當檢測到動物經過時進行拍照)、俯視圖像、水下圖像以及生物聲學。通俗來講,項目是利用數據集和深度學習架構來實現保護野生動物的目的。

項目的原理其實并不復雜。首先,利用了Megadetector v5進行對象檢測,這是一個預先訓練好的模型,用以過濾掉空圖像或含有非動物對象(如人類和車輛)的圖像。

8cc4b6fed7b969261b4d7168a8dc52dc.png圖:亞馬遜叢林的動物

Megadetector是基于Yolov5檢測模型架構,專門為動物檢測設計的深度學習模型。能夠處理來自不同地區和生態系統的大約300萬張動物圖像。

接下來,對所拍攝的視頻和圖像進行采集,把采集得到的數據喂給Megadetector v5進行識別篩選。其中,對于視頻數據,每段視頻按30fps的幀率被拆分成圖像幀,如果原視頻幀率低于30fps,則使用原始幀率。這種取舍可以平衡模型的運行效率以及識別精準度。

針對檢測到的動物對象,Pytorch-Wildlife會將它們裁剪并調整至256x256像素的尺寸,并根據圖像級別的標注為每個裁剪圖像分配標簽。

大多數深度學習模型,尤其是卷積神經網絡(CNN),它對輸入的素材是有嚴格規范的。256x256其實是一個常見的選擇,因為它既能保持一定的圖像細節,又不會使計算負擔過大。

在裁剪之后,利用Pytorch-Wildlife的分類微調模塊,采用ResNet-50作為基礎模型架構,進行動物的識別訓練。訓練設置包括60個訓練周期,批量大小為128,采用隨機梯度下降優化器,并設定學習率在每20個周期后衰減。

以往來看,開發者需要對模型進行微調,模型才能夠更好地理解和區分特定的動物類別,提高在實際野生動物監測任務中的識別準確率。而Pytorch-Wildlife框架提供的微調模塊則簡化了這一過程,使得即使是沒有深厚技術背景的研究人員,也能利用先進的深度學習技術進行動物識別模型的定制化訓練。

Pytorch-Wildlife團隊準備兩份案例,第一個是在亞馬遜叢林中檢測動物。

亞馬遜雨林是世界上最大的熱帶雨林,是地球上生物多樣性最豐富的地區之一。亞馬遜雨林里的動物數量是非常驚人的,已知的動物種類超過了10萬種,這包括鳥類、哺乳動物、爬行動物、兩棲動物以及其他無脊椎動物等。但是這個數字僅僅是已記錄和描述的物種,現代學者普遍認為,還有成千上萬甚至是數百萬種動物物種尚未被發現和描述。由于亞馬遜雨林的廣闊和復雜性,新的物種仍在不斷被發現,因此確切的動物種類數量是一個不斷變化且難以精確統計的數字。

Pytorch-Wildlife使用了一個包含41904張圖像的數據集,這些圖像覆蓋了36個已標記的動物屬,其中33569張用于訓練,8335張用于驗證。

在亞馬遜雨林項目中,模型實現了92%的識別準確率,針對90%的數據集在98%的置信度閾值下正確預測。這意味著,大部分動物圖像能夠被準確分類,只有少量需要人工審核。

除了亞馬遜叢林的案例外,Pytorch-Wlidlife還有一個在加拉帕戈斯群島的項目。這個項目的背景非常獨特,雖然加拉帕戈斯群島的動物種類也很多,然而這個脆弱的生態系統正面臨外來入侵物種的重大威脅,這些物種可能改變本地物種的種群動態并導致它們滅絕。

Pytorch-Wlidlife檢測到,一些負鼠通過船只、陸地等手段,正在入侵加拉帕戈斯群島的生態。對本地生物構成了競爭壓力,因此連續的監測和管理對于維持生態平衡至關重要。

項目中使用的數據集包含491471段視頻,這些視頻被標記為“負鼠”或“非負鼠”。數據集被劃分為訓練集和驗證集,分別包含343053段和148418段視頻。

經過驗證,Pytorch-Wildlife平臺訓練的模型針對入侵的負鼠識別達到了98%的準確率。比如下面兩張圖,由于是夜間拍攝的緣故,即便是人的肉眼也很難第一時間分清兩種動物。第一張圖片是當地的食蟻獸,第二張是外來入侵物種負鼠。

43c205fdb8d6ea81a6a108eb1b41e061.png圖:食蟻獸

8de0d7c38df1f3d107cf0080ebe7cc05.png圖:負鼠

這部片接下來要怎么拍?

Pytorch-Wildlife在監控和識別上初步取得了成功,不過這對于保護生態平衡上來說顯然還是遠遠不夠的。未來Pytorch-Wildlife將會連接LILA:BC數據集,進一步提高對物種識別的能力。

LILA數據集指的是亞歷山大圖書館的標注信息庫:生物與保護(Labeled Information Library of Alexandria:Biology and Conservation),這是一個專注于生物學和野生動物保護領域的數據集庫,提供了多樣化的開放數據資源,用于促進野生動植物的監測、保護生物學研究以及生態系統的管理。

LILA數據集包含大量經過標注的信息,比如圖片、視頻和其他類型的數據,這些數據有助于科學家和保護工作者利用機器學習和深度學習技術來識別和跟蹤野生動物,評估生物多樣性。此外,通過使用LILA進行與訓練,還能夠監測生態系統的健康狀況。

b7de21ceb6ee003af0a2dc3c4b2c14c6.png圖:Pytorch-Wildlife未來的規劃圖

數據猿也體驗了一下Megadetector的實力。識別模型選擇Megadetector v5,檢測模型選擇的是亞馬遜叢林。可以明顯看出,只要是亞馬遜叢林中出現的動物,Megadetector都能很好的識別出來。

a3b30544134b2c528e11026283edca09.png圖:亞馬遜叢林中的豹子

不過像是數據猿LOGO這種卡通動物形象,即便把識別閾值拉滿,Megadetector也沒有辦法識別出來。相反,如果是真實的動物,Megadetector只需要很低的閾值就能識別。

05f2ee5020e42e3985f666b1b43ae853.png圖:Megadetector無法識別卡通動物形象

根據開發團隊的介紹,Megadetector的最新版本,也就是Megadetector v6即將上線,識別率遠超v5版本,同時消耗的計算資源更低。目前,使用Megadetector v5檢測一張圖片耗時約為20秒,而v6版本將會讓耗時小于15秒。

另外Megadetector v6還會支持更多的低預算設備,這是因為在亞馬遜叢林等地,溫熱潮濕的生態環境會使得拍攝設備損壞率提高,沒辦法長期維持成本高昂的拍攝設備。然而成本較低的拍攝設備會導致拍攝畫面的分辨率低下,幀數低下等等,對Megadetector的識別作業起到非常負面的影響。

在未來,Pytorch-Wildlife會支持更多種類的識別方式,比如鳥瞰圖、水下拍攝。這何嘗不是一種新的云養殖野生動物的方法?

AI For Good

Pytorch-Wildlife屬于典型的AI For Good項目,這個概念由微軟提出,不過與其說是概念,更像是一種倡議。它是指在推動人工智能技術的發展與應用,以解決全球性的社會、環境和經濟挑戰,促進可持續發展。這一理念鼓勵科研人員、企業、政府、非政府組織以及社會各界合作,利用人工智能的力量創造正面影響,確保技術進步惠及全人類和地球生態。

不一定非得是動物,其他類似的方式都可以算是AI For Good。例如,通過機器學習算法監測森林砍伐、海洋污染、氣候變化和生物多樣性減少,以及開發智能系統優化資源利用和能源管理。

事實上,Pytorch-Wildlife的核心,Megadetector,幾乎沒有辦法復刻任何的商業途徑。但這個項目依然擁有足夠高的關注度,說明人們關注AI,使用AI技術,眼里并不是只有它的商業化能力,而是如何去使用AI,來建設賴以生存的家園。當然了,也有一部分人是沖著這個項目可以免費看真正的野生動物去的。

國內也有不少AI公司著手于類似的項目,比如百度的“綠色伙伴計劃”,通過AI來減少碳排放。根據記錄,百度地圖“低碳計劃”全年累計訪問量超過 4000 萬人次,累計可減少碳排放量超 3800 噸。

還有騰訊的“自然風險評估”,應用AI調優技術,騰訊2023年當年減少用電量約5000兆瓦時,避免碳排放2851.5噸。

文:火焰翼人?/?數據猿
責編:凝視深空?/?數據猿

1ad7d65aa6175a68156225402597d915.jpeg

cac43d5e6580bd77fff93af40e463223.png

bdb2f5ef2f7610d0ab86aab0705b5401.png

ccda0ddd01768285fce4f4e88766a0c1.jpeg

8c9b0ad7f29a9c4519b88cf9413a1303.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/15272.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/15272.shtml
英文地址,請注明出處:http://en.pswp.cn/web/15272.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

2024年華為OD機試真題-停車場車輛統計-C++-OD統一考試(C卷D卷)

題目描述: 特定大小的停車場,數組cars[]表示,其中1表示有車,0表示沒車。車輛大小不一,小車占一個車位(長度1),貨車占兩個車位(長度2),卡車占三個車位(長度3),統計停車場最少可以停多少輛車,返回具體的數目。 輸入描述: 整型字符串數組cars[],其中1表示有車,0…

通過Python爬取公告內容

在網絡時代,信息獲取變得更加便捷。通過網絡爬蟲技術,我們可以從互聯網上快速獲取各種信息。本文將介紹如何使用 Python 爬蟲工具從指定網站上獲取公告內容,并提取其中的關鍵信息。 1. 簡介 在本文中,我們將使用 Python 的 requ…

幾個速度比較快的 Linux 開源鏡像站及支持的資源列表

搜狐開源鏡像站 https://mirrors.sohu.com/ File Name CPAN/ FreeBSD/ QpenBSD/ RockyL apache/ archlinux/ centos/ ceph/ cygwin/ debian/ debian–cd/ debian-security/ deepin/ deepin-cd/ docker-ce/ fedora/ fedora-epel/ gentoo/ lib/ mysql/ nginx/ opensuse/ php/ ubu…

C++筆試強訓day32

目錄 1.素數回文 2.活動安排 3.合唱團 1.素數回文 鏈接https://www.nowcoder.com/practice/d638855898fb4d22bc0ae9314fed956f?tpId290&tqId39945&ru/exam/oj 現將其轉化為回文數(這里用字符串存儲比較方便轉化),然后判斷是否為…

Ubuntu安裝IPOPT和Casadi

1.IPOPT安裝 1.1安裝所需功能包 sudo apt-get install cppad sudo apt-get install gcc g gfortran subversion patch wget1.2下載最新源代碼3.14 https://www.coin-or.org/download/source/Ipopt/1.3解壓進入IPOPT安裝包,下載ASL git clone https://github.com/…

python項目中的__pycache__有什么作用?

在 Python 項目中,目錄 __pycache__ 通常用于存儲已編譯的字節碼文件。這些文件是 Python 解釋器在導入模塊時生成的,以加快后續的模塊加載速度。 具體內容 __pycache__ 目錄中的文件是以 .pyc 擴展名結尾的字節碼文件。文件名通常會包含原始 Python 源…

【FPGA】VGA顯示文字、彩條、圖片——基于DE2-115

文章目錄 前言一、VGA概述1.1 簡述1.2 管腳定義1.3 VGA顯示原理1.4 VGA時序標準1.5 VGA 顯示模式及相關參數 二、VGA顯示自定義的漢字字符2.1 點陣漢字生成2.2 生成BMP文件2.3 生成txt文件2.4 實現效果 三、VGA顯示條紋3.1 實現流程3.2 實現效果 四、VGA輸出一幅彩色圖像4.1 bm…

ArcGIS不同圖斑設置不同的透明度

對于設置一個圖層的整體的透明度,我們在 ArcGIS制作帶蒙版的遙感影像地圖http://mp.weixin.qq.com/s?__bizMzIzNjM2NTYxMg&mid2247509080&idx1&sn38dccf0a52bb3bb3758f57114ee38b72&chksme8da161bdfad9f0d363da90959a8524dcf2b60d0e8d999f8ebeef0…

Unity面試八股文之基礎篇

文章目錄 前言1. Unity的生命周期加載第一個場景Editor在第一次幀更新之前幀之間更新順序協程銷毀對象時退出時 2. Unity 協程和線程,進程的區別3. 本地坐標系 世界坐標系4. 碰撞器和觸發器的區別后話 前言 開設這個欄目的博文會寫一些有關unity的面試題目,在面試的…

如何做好軟件項目的溝通管理

如何做好軟件項目的溝通管理 軟件項目的溝通管理是確保項目信息在團隊成員、利益相關者和相關群體之間有效流通的過程。良好的溝通是項目成功的關鍵,在項目開始時,需要制定詳細的溝通計劃,包括溝通的目的、對象、內容、頻率和渠道等信息。 …

【spring】@ResponseBody注解學習

ResponseBody介紹 ResponseBody 是一個Spring框架中的注解,主要用于Web開發,特別是在Spring MVC框架中。它的核心作用是改變Spring MVC處理HTTP請求響應的行為,使得從控制器方法返回的數據直接寫入HTTP響應體(Response Body&…

Python面試寶典:Python中與網絡協議基礎和socket編程相關的知識和面試筆試題(1000加面試筆試題助你輕松捕獲大廠Offer)

Python面試寶典:1000加python面試題助你輕松捕獲大廠Offer【第二部分:Python高級特性:第十四章:網絡編程:第一節:網絡協議基礎和socket編程】 第十四章:并發編程第一節:網絡協議基礎和socket編程網絡協議基礎Socket編程創建SocketTCP服務器TCP客戶端數據傳輸關閉Socket…

Python高級進階--slice切片

slice切片?? 在 Python 中,切片操作是一種常見且方便的方式,用于從字符串、列表或元組中獲取部分元素。這種操作通過指定起始索引、結束索引和步長來實現。下面我們來看一些關于切片的簡單介紹以及一些常見用法。 1. 切片簡介 取一個str、list、tup…

【Unity2D:Animator】為角色添加動畫效果

一、添加Animator組件并創建Animator Controller文件 1. 添加Animator組件: 2. 在Assets-Art文件夾中新建一個名為Animations的文件夾,用來存儲所有動畫資源 3. 在Animations文件夾中新建一個名為Player的文件夾,再創建一個名為Animators的文…

LeetCode //C - 119. Pascal‘s Triangle II

119. Pascal’s Triangle II Given an integer rowIndex, return the rowIndexth (0-indexed) row of the Pascal’s triangle. In Pascal’s triangle, each number is the sum of the two numbers directly above it as shown: Example 1: Input: rowIndex 3 Output: …

vue項目移動端商場

一、項目前端頁面展示 二、項目整體目錄結構 三、項目流程 1. vue快速創建基礎項目 創建項目 vue create hk-shop 1 選擇需要的配置 創建基礎文件夾目錄 src文件夾下文件夾目錄: ① views 文件夾存放界面 ② components 文件夾存放界面中局部組件 ③ config 文件夾存…

【排序算法】——歸并排序(遞歸與非遞歸)含動圖

制作不易,三連支持一下吧!!! 文章目錄 前言一.歸并排序遞歸方法實現二.歸并排序非遞歸方法實現 前言 這篇博客我們將介紹歸并排序的原理和實現過程。 一、歸并排序遞歸方法實現 基本思想: 歸并排序(MERGE-…

JS(ES_6)_2

1.創建對象的6種方式&#xff1a; 1. obnew Object() ob.nameah ob.age18 2. ob{name:ah,gae:18} 3.工廠模式&#xff1a; 設計一個函數&#xff0c;專門生產Person類型的對象 <script>function createPerson(name,age,family) {var o new Object();o.name name;o.…

軟件設計師備考 | 案例專題之數據流圖 概念與例題

案例分析專題大綱&#xff1a; 數據流圖基本概念 基本圖形元素&#xff1a;外部實體、加工、數據存儲、數據流 數據流&#xff1a;由一組固定成分的數據組成&#xff0c;表示數據的流向。在DFD中&#xff0c;數據流的流向必須經過加工。加工&#xff1a;描述了輸入數據流到輸出…

啊哈!算法-第2章-棧、隊列、鏈表

啊哈!算法-第2章-棧、隊列、鏈表 第1節 解密qq號——隊列第2節 解密回文——棧第3節 紙牌游戲——小貓釣魚第4節 鏈表第5節 模擬鏈表 第1節 解密qq號——隊列 新學期開始了&#xff0c;小哈是小哼的新同桌(小哈是個大帥哥哦~)&#xff0c;小哼向小哈詢問 QQ 號&#xff0c; 小…