深度學習動物識別 - 卷積神經網絡 機器視覺 圖像識別 計算機競賽

文章目錄

  • 0 前言
  • 1 背景
  • 2 算法原理
    • 2.1 動物識別方法概況
    • 2.2 常用的網絡模型
      • 2.2.1 B-CNN
      • 2.2.2 SSD
  • 3 SSD動物目標檢測流程
  • 4 實現效果
  • 5 部分相關代碼
    • 5.1 數據預處理
    • 5.2 構建卷積神經網絡
    • 5.3 tensorflow計算圖可視化
    • 5.4 網絡模型訓練
    • 5.5 對貓狗圖像進行2分類
  • 6 最后

0 前言

🔥 優質競賽項目系列,今天要分享的是

🚩 深度學習動物識別 - 卷積神經網絡 機器視覺 圖像識別

該項目較為新穎,適合作為競賽課題方向,學長非常推薦!

🥇學長這里給一個題目綜合評分(每項滿分5分)

  • 難度系數:3分
  • 工作量:3分
  • 創新點:4分

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

1 背景

目前,由于計算機能力和相關理論的發展獲得了重大突破,基于深度學習的圖像檢測與識別技術已經廣泛應用到人們的生產生活中。學長將深度學習的技術應用到野生動物圖像識別中,優化了傳統的識別方法,形成對野生動物圖像更為準確的識別,為實現高效的野生動物圖像識別提供了可能。不同于傳統的野生動物識別,基于深度學習的野生動物識別技術可以捕獲到野生動物更加細致的信息,有利于對野生動物進行更加準確的識別和研究。因此,對基于深度學習的野生動物識別和研究,可以更好的幫助社會管理者和政府全面有效的對野生動物進行保護和監管,這也正是保護和識別野生動物的關鍵,同時這對整個自然和社會的和諧發展具有極大的推動作用。

2 算法原理

2.1 動物識別方法概況

基于人工特征的野生動物識別方法主要通過人工對野生動物圖像中具有辨識度的特征信息進行提取,并通過特征比對的方式就可以對野生動物所屬的類別進行識別判斷。

在深度學習技術普及之前,傳統的數字圖像處理技術與傳統機器學習技術一直是研究的熱點。傳統的數字圖像處理技術有模塊分割、降低噪聲點、邊緣檢測等方法。傳統的機器學習技術有支持向量機、隨機森林算法、BP
神經網絡算法等。

深度學習技術是通過計算機模擬人類大腦的分層表達結構來建立網絡模型,從原始數據集中對相關信息逐層提取。之后通過建立相應的神經網絡對數據進行學習和分析,從而提高對目標預測和識別的準確率。如今,深度學習技術已經相對成熟,在對目標進行特征提取方面,卷積神經網絡技術逐漸取代了傳統的圖像處理技術,并且在人類的生產生活中得到了廣泛應用,這為研究野生動物更高效的識別方法奠定了基礎。

2.2 常用的網絡模型

圖像識別是指對原始圖像進行整體分析來達到預測原始圖像所屬類別的技術。計算機視覺領域中對圖像識別技術進行了優化,與此同時,深度學習技術也對圖像識別領域展開了突破。目前在圖像識別領域中,研究人員開始使用深度學習的技術,并通過在實際應用中發現,基于深度學習的識別技術比傳統的識別技術效果更好,且更具有優勢。

2.2.1 B-CNN

雙線性卷積神經網絡(Bilinear
CNN,B-CNN)[34]是用兩個卷積神經網絡對圖像進行特征提取,然后使用相應的函數將得到所有特征進行組合,組合的數據帶入到分類器中進行分類。

在這里插入圖片描述

2.2.2 SSD

經典的 SSD 模型是由經典網絡和特征提取網絡組成。

通過引入性能更好的特征提取網絡對 SSD
目標檢測模型進行了優化。Fu[49]等人提出了增加卷積神經網絡層數和深度的方法用于提高識別準確率。通過實際應用之后,發現該方法識別準確率確實得到了一定程度的提高,但是模型結構卻越來越復雜,同時對深層次的網絡訓練也越來越困難。

在這里插入圖片描述

3 SSD動物目標檢測流程

在這里插入圖片描述

學長首先對 DenseNet-169 網絡進行初始化,使用 DenseNet-169 網絡作為目標檢測的前置網絡結構,并運用遷移學習的方法對
DenseNet-169 進行預訓練,并將Snapshot Serengeti數據集下的權重值遷移到野生動物檢測任務中,使數據集的訓練速度得到提升。將
DenseNet-169 作為前置網絡置于 SSD 中的目標提取檢測網絡之前,更換完前置網絡的 SSD 目標檢測網絡依然完整。

4 實現效果

在這里插入圖片描述
在這里插入圖片描述

做一個GUI交互界面

在這里插入圖片描述

5 部分相關代碼

5.1 數據預處理

?

import cv2 as cv
import os
import numpy as npimport random
import pickleimport timestart_time = time.time()data_dir = './data'
batch_save_path = './batch_files'# 創建batch文件存儲的文件夾
os.makedirs(batch_save_path, exist_ok=True)# 圖片統一大小:100 * 100
# 訓練集 20000:100個batch文件,每個文件200張圖片
# 驗證集 5000:一個測試文件,測試時 50張 x 100 批次# 進入圖片數據的目錄,讀取圖片信息
all_data_files = os.listdir(os.path.join(data_dir, 'train/'))# print(all_data_files)# 打算數據的順序
random.shuffle(all_data_files)all_train_files = all_data_files[:20000]
all_test_files = all_data_files[20000:]train_data = []
train_label = []
train_filenames = []test_data = []
test_label = []
test_filenames = []# 訓練集
for each in all_train_files:img = cv.imread(os.path.join(data_dir,'train/',each),1)resized_img = cv.resize(img, (100,100))img_data = np.array(resized_img)train_data.append(img_data)if 'cat' in each:train_label.append(0)elif 'dog' in each:train_label.append(1)else:raise Exception('%s is wrong train file'%(each))train_filenames.append(each)# 測試集
for each in all_test_files:img = cv.imread(os.path.join(data_dir,'train/',each), 1)resized_img = cv.resize(img, (100,100))img_data = np.array(resized_img)test_data.append(img_data)if 'cat' in each:test_label.append(0)elif 'dog' in each:test_label.append(1)else:raise Exception('%s is wrong test file'%(each))test_filenames.append(each)print(len(train_data), len(test_data))# 制作100個batch文件
start = 0
end = 200
for num in range(1, 101):batch_data = train_data[start: end]batch_label = train_label[start: end]batch_filenames = train_filenames[start: end]batch_name = 'training batch {} of 15'.format(num)all_data = {'data':batch_data,'label':batch_label,'filenames':batch_filenames,'name':batch_name}with open(os.path.join(batch_save_path, 'train_batch_{}'.format(num)), 'wb') as f:pickle.dump(all_data, f)start += 200end += 200# 制作測試文件
all_test_data = {'data':test_data,'label':test_label,'filenames':test_filenames,'name':'test batch 1 of 1'}with open(os.path.join(batch_save_path, 'test_batch'), 'wb') as f:pickle.dump(all_test_data, f)end_time = time.time()
print('制作結束, 用時{}秒'.format(end_time - start_time))

5.2 構建卷積神經網絡

cnn卷積神經網絡的編寫如下,編寫卷積層、池化層和全連接層的代碼

?

conv1_1 = tf.layers.conv2d(x, 16, (3, 3), padding='same', activation=tf.nn.relu, name='conv1_1')
conv1_2 = tf.layers.conv2d(conv1_1, 16, (3, 3), padding='same', activation=tf.nn.relu, name='conv1_2')
pool1 = tf.layers.max_pooling2d(conv1_2, (2, 2), (2, 2), name='pool1')
conv2_1 = tf.layers.conv2d(pool1, 32, (3, 3), padding='same', activation=tf.nn.relu, name='conv2_1')
conv2_2 = tf.layers.conv2d(conv2_1, 32, (3, 3), padding='same', activation=tf.nn.relu, name='conv2_2')
pool2 = tf.layers.max_pooling2d(conv2_2, (2, 2), (2, 2), name='pool2')
conv3_1 = tf.layers.conv2d(pool2, 64, (3, 3), padding='same', activation=tf.nn.relu, name='conv3_1')
conv3_2 = tf.layers.conv2d(conv3_1, 64, (3, 3), padding='same', activation=tf.nn.relu, name='conv3_2')
pool3 = tf.layers.max_pooling2d(conv3_2, (2, 2), (2, 2), name='pool3')
conv4_1 = tf.layers.conv2d(pool3, 128, (3, 3), padding='same', activation=tf.nn.relu, name='conv4_1')
conv4_2 = tf.layers.conv2d(conv4_1, 128, (3, 3), padding='same', activation=tf.nn.relu, name='conv4_2')
pool4 = tf.layers.max_pooling2d(conv4_2, (2, 2), (2, 2), name='pool4')flatten = tf.layers.flatten(pool4)
fc1 = tf.layers.dense(flatten, 512, tf.nn.relu)
fc1_dropout = tf.nn.dropout(fc1, keep_prob=keep_prob)
fc2 = tf.layers.dense(fc1, 256, tf.nn.relu)
fc2_dropout = tf.nn.dropout(fc2, keep_prob=keep_prob)
fc3 = tf.layers.dense(fc2, 2, None)

5.3 tensorflow計算圖可視化

?

self.x = tf.placeholder(tf.float32, [None, IMAGE_SIZE, IMAGE_SIZE, 3], 'input_data')
self.y = tf.placeholder(tf.int64, [None], 'output_data')
self.keep_prob = tf.placeholder(tf.float32)# 圖片輸入網絡中
fc = self.conv_net(self.x, self.keep_prob)
self.loss = tf.losses.sparse_softmax_cross_entropy(labels=self.y, logits=fc)
self.y_ = tf.nn.softmax(fc) # 計算每一類的概率
self.predict = tf.argmax(fc, 1)
self.acc = tf.reduce_mean(tf.cast(tf.equal(self.predict, self.y), tf.float32))
self.train_op = tf.train.AdamOptimizer(LEARNING_RATE).minimize(self.loss)
self.saver = tf.train.Saver(max_to_keep=1)

最后的saver是要將訓練好的模型保存到本地。

5.4 網絡模型訓練

然后編寫訓練部分的代碼,訓練步驟為1萬步

?

acc_list = []
with tf.Session() as sess:sess.run(tf.global_variables_initializer())for i in range(TRAIN_STEP):train_data, train_label, _ = self.batch_train_data.next_batch(TRAIN_SIZE)eval_ops = [self.loss, self.acc, self.train_op]eval_ops_results = sess.run(eval_ops, feed_dict={self.x:train_data,self.y:train_label,self.keep_prob:0.7})loss_val, train_acc = eval_ops_results[0:2]acc_list.append(train_acc)if (i+1) % 100 == 0:acc_mean = np.mean(acc_list)print('step:{0},loss:{1:.5},acc:{2:.5},acc_mean:{3:.5}'.format(i+1,loss_val,train_acc,acc_mean))if (i+1) % 1000 == 0:test_acc_list = []for j in range(TEST_STEP):test_data, test_label, _ = self.batch_test_data.next_batch(TRAIN_SIZE)acc_val = sess.run([self.acc],feed_dict={self.x:test_data,self.y:test_label,self.keep_prob:1.0})test_acc_list.append(acc_val)print('[Test ] step:{0}, mean_acc:{1:.5}'.format(i+1, np.mean(test_acc_list)))# 保存訓練后的模型os.makedirs(SAVE_PATH, exist_ok=True)self.saver.save(sess, SAVE_PATH + 'my_model.ckpt')

訓練結果如下:

在這里插入圖片描述

5.5 對貓狗圖像進行2分類

在這里插入圖片描述

在這里插入圖片描述

6 最后

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/163633.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/163633.shtml
英文地址,請注明出處:http://en.pswp.cn/news/163633.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

課堂巡課如何提升教學質量?簡單才是硬道理

隨著教育技術的不斷發展,在線巡課系統逐漸成為學校管理和教育質量提升的重要工具。在線巡課系統通過數字化手段,為學校提供了更加高效、精準的巡課管理方式,有力地支持了教育教學的改進和優化。 客戶案例 小學巡課項目 山東某小學引入了泛地…

視頻號小店商家,怎么選品?實操經驗分享!

我是電商珠珠 視頻號團隊在22年7月開始發展自己的電商平臺-視頻號小店,截止到目前為止,也已經發展了一年的時間了。 現在的視頻號小店就相當于當初的抖音小店,其風口正盛,平臺也在大力扶持商家,給予商家更多的紅利。…

8.5 Windows驅動開發:內核注冊表增刪改查

注冊表是Windows中的一個重要的數據庫,用于存儲系統和應用程序的設置信息,注冊表是一個巨大的樹形結構,無論在應用層還是內核層操作注冊表都有獨立的API函數可以使用,而在內核中讀寫注冊表則需要使用內核裝用API函數,如…

海外媒體推廣發稿平臺這8種方法助你一臂之力-華媒舍

在全球經濟一體化和信息技術快速進步的背景下,海外市場的開拓對于企業的發展至關重要。要在海外市場上取得成果并非易事,因此我們需要借助一些方法來幫助我們取得成功。其中,海外媒體推廣發稿平臺是非常有效的工具之一。本文將介紹8種方法&am…

組件庫篇 | EUI | 輸入框

組件庫篇 | EUI | 輸入框 輸入框 Input 創建輸入框 Input input(230, 50, 180, 30); // 創建了一個寬230,高50的輸入框,坐標為(180,30)一個輸入框就出現在界面上了,如果你用過EasyX的InputBox,你就會深刻體會到現代化的輸入框和古老輸入框的區別。 注意: input是一個…

SSM家具個性定制管理系統開發mysql數據庫web結構java編程計算機網頁源碼eclipse項目

一、源碼特點 SSM 家具個性定制管理系統是一套完善的信息系統,結合springMVC框架完成本系統,對理解JSP java編程開發語言有幫助系統采用SSM框架(MVC模式開發),系統具有完整的源代碼和數據庫,系統主要采用…

低代碼表單設計器:可視化+靈活+易操作,降本增效輕松實現!

在現代化辦公環境中,擁有先進的低代碼表單設計器,可以讓企業降本又增效,節約企業成本的同時,也能高效利用企業內部資源,為實現數字化轉型升級提供夯實根基。那么,低代碼表單設計器擁有什么樣的特點&#xf…

張弛語言課,喜劇為什么使人快樂?

在為喜劇類電視劇或電影進行配音時,配音員需要展現出對幽默元素的敏感把握、對劇中笑料的恰到好處的呈現,以及對節奏的精確控制。喜劇的魅力在于其歡樂和幽默,所以配音工作的目標是激發觀眾的笑感,同時保持故事的流暢性和角色的個…

Composer update 跳過指定依賴

在使用Compose進PHP 依賴管理只時,有時候我們可能希望忽略版本批配,即使依賴項的景新版本已經發布,也然續使用當前的樂本。這種情況下,我們可以使用Composer的 --ignore-platform-reqs 選項來實現 可以使用--ignore-platform-req…

文心一言AI大模型,前端接入

文心一言AI大模型,前端接入 一、參考接口資料 模型廣場:https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 我的應用:https://console.bce.baidu.com/qianfan/ais/console/onlineService 千帆大模型調用API介紹&…

捷誠管理信息系統 SQL注入漏洞

聲明 本文僅用于技術交流,請勿用于非法用途 由于傳播、利用此文所提供的信息而造成的任何直接或者間接的后果及損失,均由使用者本人負責,文章作者不為此承擔任何責任。 一、產品介紹 捷誠管理信息系統是一款功能全面,可以支持自…

地埋式積水監測儀廠家直銷推薦,致力于積水監測

地埋式積水監測儀是一種高科技設備,能夠實時監測地面積水深度,并及時發出預警信息,有效避免因積水而產生的安全隱患。這種智能監測儀可以安裝在城市道路、立交橋、地下車庫等易積水地勢較低的地方,以確保及時監測特殊地段的積水&a…

數據庫數據恢復—SQLserver數據庫中勒索病毒被加密的數據恢復案例

SQLserver數據庫數據恢復環境&故障: 一臺服務器上的SQLserver數據庫被勒索病毒加密,無法正常使用。該服務器上部署有多個SQLserver數據庫,其中有2個數據庫及備份文件被加密,文件名被篡改,數據庫無法使用。 SQL se…

基于框架的線性回歸

線性回歸是機器學習中最簡單和最常用的回歸方法之一。它建立了自變量和因變量之間的線性關系,并通過擬合一條直線或超平面來預測和分析數據。 基于框架的線性回歸是構建線性回歸模型的一種常見方法,它利用現有的機器學習框架來實現線性回歸模型的建立、…

企業郵箱即時提醒服務推薦

現在用企業郵箱比較多,但是不能即時提醒,總是誤事,什么郵箱可以即時提醒呢?隨著工作和生活節奏的加快,傳統的電子郵件系統由于不能即時提醒,往往會導致重要郵件的漏接,從而引發一系列的麻煩和誤…

探秘ARouter:Android路由的藝術

引言 在Android的組件化架構中,有效地管理活動(Activity)跳轉和服務調用是至關重要的。ARouter作為一個前沿的路由框架,提供了強大的工具來簡化這一過程。本博客將深入探討ARouter的實現原理,幫助開發者更好地理解其背…

postgresql docker 安裝和需要關注點

1. 關于 最近都在搞國產化信創,關于DB這塊也來一波浪潮,很多國產化的數據庫也是基于postgesql研發的。 PostgreSQL開源生態是國內數據庫發展及應用的強大引擎,越來越多的國產數據庫選擇加入到PostgreSQL生態中,開枝散葉。 看下官…

理解C++編譯指令#pragma pack(1)

#pragma pack(1)是一個編譯器指令,它用來指定結構體,聯合體,和類的成員的內存對齊方式。內存對齊是一種優化內存訪問速度的技術,它會根據數據類型的大小來調整數據在內存中的位置,使得數據的起始地址是它的大小的整數倍…

Python基礎【三】--數據類型-Number【2023.11.23】

1.數值類型 Number數據類型只要包括三個分別是:整型(int)、浮點型(float)、復數(complex) 整型:包括正整數、負整數。如:1024、-1024。整型有四種進制表示,分…

QGIS之二十五兩個面圖層數據中選擇圖形完全一致的數據

效果 步驟 1、準備數據 2、按位置選擇 在Qgis工具箱中搜索"按位置選擇"工具 選擇要素和比較要素根據實際選擇 運行 3、結果