計算機設計大賽 深度學習動物識別 - 卷積神經網絡 機器視覺 圖像識別

文章目錄

  • 0 前言
  • 1 背景
  • 2 算法原理
    • 2.1 動物識別方法概況
    • 2.2 常用的網絡模型
      • 2.2.1 B-CNN
      • 2.2.2 SSD
  • 3 SSD動物目標檢測流程
  • 4 實現效果
  • 5 部分相關代碼
    • 5.1 數據預處理
    • 5.2 構建卷積神經網絡
    • 5.3 tensorflow計算圖可視化
    • 5.4 網絡模型訓練
    • 5.5 對貓狗圖像進行2分類
  • 6 最后

0 前言

🔥 優質競賽項目系列,今天要分享的是

🚩 深度學習動物識別 - 卷積神經網絡 機器視覺 圖像識別

該項目較為新穎,適合作為競賽課題方向,學長非常推薦!

🥇學長這里給一個題目綜合評分(每項滿分5分)

  • 難度系數:3分
  • 工作量:3分
  • 創新點:4分

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

1 背景

目前,由于計算機能力和相關理論的發展獲得了重大突破,基于深度學習的圖像檢測與識別技術已經廣泛應用到人們的生產生活中。學長將深度學習的技術應用到野生動物圖像識別中,優化了傳統的識別方法,形成對野生動物圖像更為準確的識別,為實現高效的野生動物圖像識別提供了可能。不同于傳統的野生動物識別,基于深度學習的野生動物識別技術可以捕獲到野生動物更加細致的信息,有利于對野生動物進行更加準確的識別和研究。因此,對基于深度學習的野生動物識別和研究,可以更好的幫助社會管理者和政府全面有效的對野生動物進行保護和監管,這也正是保護和識別野生動物的關鍵,同時這對整個自然和社會的和諧發展具有極大的推動作用。

2 算法原理

2.1 動物識別方法概況

基于人工特征的野生動物識別方法主要通過人工對野生動物圖像中具有辨識度的特征信息進行提取,并通過特征比對的方式就可以對野生動物所屬的類別進行識別判斷。

在深度學習技術普及之前,傳統的數字圖像處理技術與傳統機器學習技術一直是研究的熱點。傳統的數字圖像處理技術有模塊分割、降低噪聲點、邊緣檢測等方法。傳統的機器學習技術有支持向量機、隨機森林算法、BP
神經網絡算法等。

深度學習技術是通過計算機模擬人類大腦的分層表達結構來建立網絡模型,從原始數據集中對相關信息逐層提取。之后通過建立相應的神經網絡對數據進行學習和分析,從而提高對目標預測和識別的準確率。如今,深度學習技術已經相對成熟,在對目標進行特征提取方面,卷積神經網絡技術逐漸取代了傳統的圖像處理技術,并且在人類的生產生活中得到了廣泛應用,這為研究野生動物更高效的識別方法奠定了基礎。

2.2 常用的網絡模型

圖像識別是指對原始圖像進行整體分析來達到預測原始圖像所屬類別的技術。計算機視覺領域中對圖像識別技術進行了優化,與此同時,深度學習技術也對圖像識別領域展開了突破。目前在圖像識別領域中,研究人員開始使用深度學習的技術,并通過在實際應用中發現,基于深度學習的識別技術比傳統的識別技術效果更好,且更具有優勢。

2.2.1 B-CNN

雙線性卷積神經網絡(Bilinear
CNN,B-CNN)[34]是用兩個卷積神經網絡對圖像進行特征提取,然后使用相應的函數將得到所有特征進行組合,組合的數據帶入到分類器中進行分類。

在這里插入圖片描述

2.2.2 SSD

經典的 SSD 模型是由經典網絡和特征提取網絡組成。

通過引入性能更好的特征提取網絡對 SSD
目標檢測模型進行了優化。Fu[49]等人提出了增加卷積神經網絡層數和深度的方法用于提高識別準確率。通過實際應用之后,發現該方法識別準確率確實得到了一定程度的提高,但是模型結構卻越來越復雜,同時對深層次的網絡訓練也越來越困難。

在這里插入圖片描述

3 SSD動物目標檢測流程

在這里插入圖片描述

學長首先對 DenseNet-169 網絡進行初始化,使用 DenseNet-169 網絡作為目標檢測的前置網絡結構,并運用遷移學習的方法對
DenseNet-169 進行預訓練,并將Snapshot Serengeti數據集下的權重值遷移到野生動物檢測任務中,使數據集的訓練速度得到提升。將
DenseNet-169 作為前置網絡置于 SSD 中的目標提取檢測網絡之前,更換完前置網絡的 SSD 目標檢測網絡依然完整。

4 實現效果

在這里插入圖片描述
在這里插入圖片描述

做一個GUI交互界面

在這里插入圖片描述

5 部分相關代碼

5.1 數據預處理

?

import cv2 as cv
import os
import numpy as npimport random
import pickleimport timestart_time = time.time()data_dir = './data'
batch_save_path = './batch_files'# 創建batch文件存儲的文件夾
os.makedirs(batch_save_path, exist_ok=True)# 圖片統一大小:100 * 100
# 訓練集 20000:100個batch文件,每個文件200張圖片
# 驗證集 5000:一個測試文件,測試時 50張 x 100 批次# 進入圖片數據的目錄,讀取圖片信息
all_data_files = os.listdir(os.path.join(data_dir, 'train/'))# print(all_data_files)# 打算數據的順序
random.shuffle(all_data_files)all_train_files = all_data_files[:20000]
all_test_files = all_data_files[20000:]train_data = []
train_label = []
train_filenames = []test_data = []
test_label = []
test_filenames = []# 訓練集
for each in all_train_files:img = cv.imread(os.path.join(data_dir,'train/',each),1)resized_img = cv.resize(img, (100,100))img_data = np.array(resized_img)train_data.append(img_data)if 'cat' in each:train_label.append(0)elif 'dog' in each:train_label.append(1)else:raise Exception('%s is wrong train file'%(each))train_filenames.append(each)# 測試集
for each in all_test_files:img = cv.imread(os.path.join(data_dir,'train/',each), 1)resized_img = cv.resize(img, (100,100))img_data = np.array(resized_img)test_data.append(img_data)if 'cat' in each:test_label.append(0)elif 'dog' in each:test_label.append(1)else:raise Exception('%s is wrong test file'%(each))test_filenames.append(each)print(len(train_data), len(test_data))# 制作100個batch文件
start = 0
end = 200
for num in range(1, 101):batch_data = train_data[start: end]batch_label = train_label[start: end]batch_filenames = train_filenames[start: end]batch_name = 'training batch {} of 15'.format(num)all_data = {'data':batch_data,'label':batch_label,'filenames':batch_filenames,'name':batch_name}with open(os.path.join(batch_save_path, 'train_batch_{}'.format(num)), 'wb') as f:pickle.dump(all_data, f)start += 200end += 200# 制作測試文件
all_test_data = {'data':test_data,'label':test_label,'filenames':test_filenames,'name':'test batch 1 of 1'}with open(os.path.join(batch_save_path, 'test_batch'), 'wb') as f:pickle.dump(all_test_data, f)end_time = time.time()
print('制作結束, 用時{}秒'.format(end_time - start_time))

5.2 構建卷積神經網絡

cnn卷積神經網絡的編寫如下,編寫卷積層、池化層和全連接層的代碼

?

conv1_1 = tf.layers.conv2d(x, 16, (3, 3), padding='same', activation=tf.nn.relu, name='conv1_1')
conv1_2 = tf.layers.conv2d(conv1_1, 16, (3, 3), padding='same', activation=tf.nn.relu, name='conv1_2')
pool1 = tf.layers.max_pooling2d(conv1_2, (2, 2), (2, 2), name='pool1')
conv2_1 = tf.layers.conv2d(pool1, 32, (3, 3), padding='same', activation=tf.nn.relu, name='conv2_1')
conv2_2 = tf.layers.conv2d(conv2_1, 32, (3, 3), padding='same', activation=tf.nn.relu, name='conv2_2')
pool2 = tf.layers.max_pooling2d(conv2_2, (2, 2), (2, 2), name='pool2')
conv3_1 = tf.layers.conv2d(pool2, 64, (3, 3), padding='same', activation=tf.nn.relu, name='conv3_1')
conv3_2 = tf.layers.conv2d(conv3_1, 64, (3, 3), padding='same', activation=tf.nn.relu, name='conv3_2')
pool3 = tf.layers.max_pooling2d(conv3_2, (2, 2), (2, 2), name='pool3')
conv4_1 = tf.layers.conv2d(pool3, 128, (3, 3), padding='same', activation=tf.nn.relu, name='conv4_1')
conv4_2 = tf.layers.conv2d(conv4_1, 128, (3, 3), padding='same', activation=tf.nn.relu, name='conv4_2')
pool4 = tf.layers.max_pooling2d(conv4_2, (2, 2), (2, 2), name='pool4')flatten = tf.layers.flatten(pool4)
fc1 = tf.layers.dense(flatten, 512, tf.nn.relu)
fc1_dropout = tf.nn.dropout(fc1, keep_prob=keep_prob)
fc2 = tf.layers.dense(fc1, 256, tf.nn.relu)
fc2_dropout = tf.nn.dropout(fc2, keep_prob=keep_prob)
fc3 = tf.layers.dense(fc2, 2, None)

5.3 tensorflow計算圖可視化

?

self.x = tf.placeholder(tf.float32, [None, IMAGE_SIZE, IMAGE_SIZE, 3], 'input_data')
self.y = tf.placeholder(tf.int64, [None], 'output_data')
self.keep_prob = tf.placeholder(tf.float32)# 圖片輸入網絡中
fc = self.conv_net(self.x, self.keep_prob)
self.loss = tf.losses.sparse_softmax_cross_entropy(labels=self.y, logits=fc)
self.y_ = tf.nn.softmax(fc) # 計算每一類的概率
self.predict = tf.argmax(fc, 1)
self.acc = tf.reduce_mean(tf.cast(tf.equal(self.predict, self.y), tf.float32))
self.train_op = tf.train.AdamOptimizer(LEARNING_RATE).minimize(self.loss)
self.saver = tf.train.Saver(max_to_keep=1)

最后的saver是要將訓練好的模型保存到本地。

5.4 網絡模型訓練

然后編寫訓練部分的代碼,訓練步驟為1萬步

?

acc_list = []
with tf.Session() as sess:sess.run(tf.global_variables_initializer())for i in range(TRAIN_STEP):train_data, train_label, _ = self.batch_train_data.next_batch(TRAIN_SIZE)eval_ops = [self.loss, self.acc, self.train_op]eval_ops_results = sess.run(eval_ops, feed_dict={self.x:train_data,self.y:train_label,self.keep_prob:0.7})loss_val, train_acc = eval_ops_results[0:2]acc_list.append(train_acc)if (i+1) % 100 == 0:acc_mean = np.mean(acc_list)print('step:{0},loss:{1:.5},acc:{2:.5},acc_mean:{3:.5}'.format(i+1,loss_val,train_acc,acc_mean))if (i+1) % 1000 == 0:test_acc_list = []for j in range(TEST_STEP):test_data, test_label, _ = self.batch_test_data.next_batch(TRAIN_SIZE)acc_val = sess.run([self.acc],feed_dict={self.x:test_data,self.y:test_label,self.keep_prob:1.0})test_acc_list.append(acc_val)print('[Test ] step:{0}, mean_acc:{1:.5}'.format(i+1, np.mean(test_acc_list)))# 保存訓練后的模型os.makedirs(SAVE_PATH, exist_ok=True)self.saver.save(sess, SAVE_PATH + 'my_model.ckpt')

訓練結果如下:

在這里插入圖片描述

5.5 對貓狗圖像進行2分類

在這里插入圖片描述

在這里插入圖片描述

6 最后

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/696918.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/696918.shtml
英文地址,請注明出處:http://en.pswp.cn/news/696918.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從零學算法238

238.給你一個整數數組 nums,返回 數組 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘積 。 題目數據 保證 數組 nums之中任意元素的全部前綴元素和后綴的乘積都在 32 位 整數范圍內。 請 不要使用除法,且在 O(n) 時間復…

Python自動化UI測試之Selenium基礎實操

1. Selenium簡介 Selenium 是一個用于 Web 應用程序測試的工具。最初是為網站自動化測試而開發的,可以直接運行在瀏覽器上,支持的瀏覽器包括 IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Googl…

SVN忽略已提交的文件(ignore,移出版本控制)

本文適用于已安裝TortoiseSVN客戶端的同學。 1、右鍵點擊要忽略的文件夾或文件,鼠標移到“TortoiseSVN”,找到“Unversion and add to ignore list”,選擇文件夾,彈出提示框確認忽略。 2、設置完忽略文件后,還需要做…

多維時序 | Matlab實現GRU-MATT門控循環單元融合多頭注意力多變量時間序列預測模型

多維時序 | Matlab實現GRU-MATT門控循環單元融合多頭注意力多變量時間序列預測模型 目錄 多維時序 | Matlab實現GRU-MATT門控循環單元融合多頭注意力多變量時間序列預測模型預測效果基本介紹程序設計參考資料 預測效果 基本介紹 1.多維時序 | Matlab實現GRU-MATT門控循環單元融…

【Maven】介紹、下載及安裝、集成IDEA

目錄 一、什么是Maven Maven的作用 Maven模型 Maven倉庫 二、下載及安裝 三、IDEA集成Maven 1、POM配置詳解 2、配置Maven環境 局部配置 全局設置 四、創建Maven項目 五、Maven坐標詳解 六、導入Maven項目 方式1:使用Maven面板,快速導入項目 …

React Native框架開發介紹,以及其優點

大家好,我是咕嚕鐵蛋,在今天的文章中,我通過科技手段和大家一起探討一下React Native框架的開發介紹以及其優點。我深知選擇合適的開發工具對于項目的成功至關重要。而React Native作為一款流行的跨平臺移動應用開發框架,其獨特之…

Linux并發與競爭的基本概念

一. 簡介 Linux是一個多任務操作系統,肯定會存在多個任務共同操作同一段內存或者設備的情況, 多個任務甚至中斷都能訪問的資源叫做共享資源,在驅動開發中要注意對共享資源的保護,也就是要處理對共享資源的并發訪問。比如&#xf…

【服務器數據恢復】FreeNAS+ESXi虛擬機數據恢復案例

服務器數據恢復環境: 一臺服務器通過FreeNAS(本案例使用的是UFS2文件系統)實現iSCSI存儲,整個UFS2文件系統作為一個文件掛載到ESXi虛擬化系統(安裝在另外2臺服務器上)上。該虛擬化系統一共有5臺虛擬機&…

2024水科技大會暨技術裝備成果展覽會——高品質供水和飲用水水源安全保障論壇

供水與飲水安全直接關系到人民群眾的生活與健康,切實做好城市供水與飲水安全保障工作,是把以人為本真正落到實處的一項緊迫任務。近年來,中央和地方加大了城鄉供水與飲水安全保障工作的力度,對標最優質供水城市建設要求&#xff0…

[Angular 基礎] - service 服務

[Angular 基礎] - service 服務 之前的筆記就列舉三個好了……沒想到 Angular 東西這么多(ー ー;)……全加感覺越來越湊字數了 [Angular 基礎] - 視圖封裝 & 局部引用 & 父子組件中內容傳遞 [Angular 基礎] - 生命周期函數 [Angular 基礎] - 自…

請簡述你對SpringMVC的理解

SpringMVC是一種基于Java語言開發,實現了WebMVC設計模式,請求驅動類型 的輕量級Web框架。 采用了MVC架構模式的思想,通過把Model,View,Controller分離,將Web層進 行職責解耦,從而把復雜的Web應…

idea打開項目白屏

解決方法: 右鍵“最大化” idea打開項目白板解決方案_idea打開白屏-CSDN博客 IDEA 2022 CPU占用100%的問題及解決方法_java_腳本之家

STM32控制數碼管從0顯示到99

首先 先畫電路圖吧!打開proteus,導入相關器件,繪制電路圖。如下:(記得要保存啊!發現模擬一遍程序就自動退出了,有bug,我是解決不了,所以就是要及時保存,自己重…

計算機組成原理(10)----微程序控制器

目錄 1.微程序控制器的設計思想 2.微指令的基本格式 3.微程序控制器的基本結構 (1)控制存儲器CM (2)CMAR (3)地址譯碼 (4)CMDR (5)微地址形成部件 &…

31.云原生Istio可觀測性之官網Bookinfo應用實戰演示

云原生專欄大綱 文章目錄 可觀測性kiali介紹Overview(概觀)Application(應用維度)workloads(負載維度)Services(服務維度)Istio Config(配置維度) Kiali部署…

音頻聲波的主觀感受

一、響度 聲壓是“客觀”的,響度是“主觀”的。 響度又稱音量。人耳感受到的聲音強弱,它是人對聲音大小的一個主觀感覺量。響度的大小決定于聲音接收處的波幅,就同一聲源來說,波幅傳播的愈遠,響度愈小…

React18原理: React核心對象之Update、UpdateQueue、Hook、Task對象

Update 與 UpdateQueue 對象 1 ) 概述 在fiber對象中有一個屬性 fiber.updateQueue是一個鏈式隊列(即使用鏈表實現的隊列存儲結構)是和頁面更新有關的 2 )Update對象相關的數據結構 // https://github.com/facebook/react/blob/v18.2.0/pa…

【Nginx】Nginx配置反向代理 和 https

nginx.conf配置 進入linux /etc/nginx/ 打開nginx.conf 進行以下配置 http {include mime.types;default_type application/octet-stream;sendfile on;keepalive_timeout 65;server {#監聽443端口listen 443 ssl;#你的域名server_name huiblog.top;#ssl證書的pe…

VSCode The preLaunchTask ‘C/C++: clang++ 生成活動文件‘ terminated with exit code -1

更改tasks.json文件里面的type為shell 選擇g 選擇g,然后點回到text.c,按下F5. 得到結果。 文中內容參考: 從零開始手把手教你配置屬于你的VS Code_嗶哩嗶哩_bilibili https://blog.csdn.net/qq_63872647/article/details/128006861

【EasyV】QGIS轉換至EasyV

QGIS轉換至EasyV 第一步:導入QGIS第二步 坐標系轉換第三步 集合修正第四步 重命名字段第五步 導出WGS geojson坐標第六步 導入EasyV 第一步:導入QGIS 第二步 坐標系轉換 第三步 集合修正 第四步 重命名字段 第五步 導出WGS geojson坐標 第六步 導入EasyV…