Python學習之路(玖)-圖像識別的實現

在 Python 中,圖像識別對比通常涉及 圖像相似度計算目標檢測與匹配。-淺看一下就行,具體功能代碼,后期會逐步上傳資源。


一、技術方案

1. 圖像相似度計算

  • 目標:計算兩幅圖像的相似度。
  • 工具
    • OpenCV:圖像處理基礎庫。
    • 特征提取:SIFT、SURF、ORB。
    • 深度學習:使用預訓練模型(如 VGG、ResNet)提取特征。

2. 目標檢測與匹配

  • 目標:檢測圖像中的目標,并進行匹配。
  • 工具
    • YOLO/Faster R-CNN:目標檢測模型。
    • OpenCV:特征匹配(如 BFMatcher、FLANN)。

3. 圖像哈希

  • 目標:通過哈希值快速比較圖像。
  • 工具
    • ImageHash:計算圖像的感知哈希(如 pHash、dHash)。

二、實現步驟

1. 圖像相似度計算

使用 OpenCV深度學習模型 計算圖像相似度。

示例代碼(OpenCV + SIFT):
import cv2# 加載圖像
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 初始化 SIFT 檢測器
sift = cv2.SIFT_create()# 檢測關鍵點和描述符
keypoints1, descriptors1 = sift.detectAndCompute(img1, None)
keypoints2, descriptors2 = sift.detectAndCompute(img2, None)# 使用 BFMatcher 進行匹配
bf = cv2.BFMatcher()
matches = bf.knnMatch(descriptors1, descriptors2, k=2)# 過濾匹配點
good_matches = []
for m, n in matches:if m.distance < 0.75 * n.distance:good_matches.append(m)# 計算相似度
similarity = len(good_matches) / min(len(keypoints1), len(keypoints2))
print("Similarity:", similarity)
示例代碼(深度學習 + VGG):
from tensorflow.keras.applications.vgg16 import VGG16, preprocess_input
from tensorflow.keras.preprocessing import image
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np# 加載預訓練模型
model = VGG16(weights='imagenet', include_top=False, pooling='avg')# 加載圖像并預處理
def load_and_preprocess(img_path):img = image.load_img(img_path, target_size=(224, 224))img = image.img_to_array(img)img = np.expand_dims(img, axis=0)return preprocess_input(img)img1 = load_and_preprocess('image1.jpg')
img2 = load_and_preprocess('image2.jpg')# 提取特征
features1 = model.predict(img1).flatten()
features2 = model.predict(img2).flatten()# 計算余弦相似度
similarity = cosine_similarity([features1], [features2])[0][0]
print("Similarity:", similarity)

2. 目標檢測與匹配

使用 YOLO 檢測目標,并使用 OpenCV 進行匹配。

示例代碼(YOLO + OpenCV):
from ultralytics import YOLO
import cv2# 加載 YOLO 模型
model = YOLO('yolov8n.pt')# 檢測圖像中的目標
results1 = model('image1.jpg')
results2 = model('image2.jpg')# 提取檢測結果
boxes1 = results1[0].boxes.xyxy.cpu().numpy()
boxes2 = results2[0].boxes.xyxy.cpu().numpy()# 計算 IoU(交并比)
def calculate_iou(box1, box2):x1 = max(box1[0], box2[0])y1 = max(box1[1], box2[1])x2 = min(box1[2], box2[2])y2 = min(box1[3], box2[3])intersection = max(0, x2 - x1) * max(0, y2 - y1)area1 = (box1[2] - box1[0]) * (box1[3] - box1[1])area2 = (box2[2] - box2[0]) * (box2[3] - box2[1])return intersection / (area1 + area2 - intersection)# 匹配目標
for box1 in boxes1:for box2 in boxes2:iou = calculate_iou(box1, box2)if iou > 0.5:  # 設置閾值print("Matched boxes with IoU:", iou)

3. 圖像哈希

使用 ImageHash 計算圖像的哈希值。

示例代碼(ImageHash):
from PIL import Image
import imagehash# 加載圖像
hash1 = imagehash.phash(Image.open('image1.jpg'))
hash2 = imagehash.phash(Image.open('image2.jpg'))# 計算哈希距離
distance = hash1 - hash2
print("Hash distance:", distance)

三、優化建議

優化點建議
特征提取使用深度學習模型(如 VGG、ResNet)提取更高級的特征
匹配算法使用 FLANN 替代 BFMatcher,提升匹配效率
目標檢測使用 YOLOv8 或 Faster R-CNN 提高檢測精度
哈希算法根據需求選擇 pHash(感知哈希)或 dHash(差異哈希)
硬件加速使用 GPU 加速深度學習模型推理

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/905068.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/905068.shtml
英文地址,請注明出處:http://en.pswp.cn/news/905068.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【C語言文件操作詳解】fopen 函數全解析 —— 模式參數、使用技巧與重定向的區別

在 C 語言中&#xff0c;文件的讀寫是一個非常常見的需求。fopen 是標準庫中提供的函數&#xff0c;用來打開文件&#xff0c;返回一個文件指針供后續操作使用。本篇博客將詳細介紹 fopen 的使用方法、每個參數的含義&#xff0c;以及它與 Shell 中 >、>> 重定向符的聯…

青少年編程與數學 02-019 Rust 編程基礎 02課題、開始編程

青少年編程與數學 02-019 Rust 編程基礎 02課題、開始編程 一、游戲規則二、實現步驟1. 創建項目2. 編寫代碼3. 添加依賴4. 運行程序 三、代碼解析四、println! 的用法基本用法使用占位符示例控制輸出寬度和精度示例 輸出多個變量示例 注意事項小結 五、管理多個項目1. 創建 Wo…

拒絕flash插件打劫!如何在vscode上玩4399小游戲

現在電腦上玩4399都需要flash插件了 這也導致了很多人無法玩到小時候的游戲 今天介紹一款插件 功能強大 即安即玩 首先打開vscode 點開小方框&#xff08;拓展&#xff09;搜索4399 認準4399 on vscode點擊安裝 安裝完畢后 按下 Ctrl Shift P , 輸入 4399 on VSCode 或…

RHCSA Linux系統 Web頁面 論壇 網盤的搭建

Web 服務搭建 [rootlocalhost ~]#yum install httpd -y [rootlocalhost ~]#cd /var/www/htm1/ [rootalocalhost html]#echo 江停嚴峫 >index.html [rootlocalhost html]#setenforce 0 #將 SELinux 模式設置為寬容模式&#xff0c;不強制執行安全策略 [rootlocalhost h…

力扣刷題——二分查找總結

我們可以總結出二分查找的通用做法和常見變種。二分查找是一種在有序數組中高效查找元素的算法&#xff0c;時間復雜度為 O (log n)。 二分查找的通用模板 二分查找的核心思想是將搜索范圍不斷縮小一半&#xff0c;直到找到目標元素或確定其不存在。以下是通用模板&#xff1…

開源數字人框架 AWESOME-DIGITAL-HUMAN 技術解析與應用指南

一、項目概述 AWESOME-DIGITAL-HUMAN 是一個基于 Live2D 技術的開源數字人框架&#xff0c;它集成了語音識別&#xff08;ASR&#xff09;、大語言模型&#xff08;LLM&#xff09;、語音合成&#xff08;TTS&#xff09;和 Agent 模塊化擴展能力&#xff0c;支持快速部署和自…

互聯網大廠Java求職面試:基于RAG的智能問答系統設計與實現-2

互聯網大廠Java求職面試&#xff1a;基于RAG的智能問答系統設計與實現-2 面試背景 鄭薪苦是一名Java開發者&#xff0c;擁有豐富的項目經驗&#xff0c;但在面試中總喜歡用奇葩比喻解釋技術問題。今天他面對的是某大廠技術總監張總&#xff0c;面試主題為“基于RAG的智能問答…

(二)Linux下基本指令 2

【知識預告】 16. date 指令 17. cal 指令 18. find 指令 19. which指令 20. whereis 指令 21. alias 指令 22. grep 指令 23. zip/unzip 指令 24. tar 指令 25. bc 指令 26. uname ?r 指令 27. 重要的?個熱鍵 28. 關機 16 date 指令 指定格式顯?時間&#xff1a;date %Y-…

命令行解釋器中shell、bash和zsh的區別

命令行解釋器&#xff08;Command Line Interpreter&#xff09;是一個程序&#xff0c;它的主要作用是接收用戶輸入的命令&#xff0c;并執行相應的操作。它充當了用戶與操作系統內核之間的橋梁。 一、什么是 Shell&#xff1f; Shell 是一個通用術語&#xff0c;指的是 命令…

二、transformers基礎組件之Tokenizer

在使用神經網絡處理自然語言處理任務時&#xff0c;我們首先需要對數據進行預處理&#xff0c;將數據從字符串轉換為神經網絡可以接受的格式&#xff0c;一般會分為如下幾步: - Step1 分詞:使用分詞器對文本數據進行分詞(字、字詞);- Step2 構建詞典:根據數據集分詞的結果,構建…

鏡像和容器的管理

一、鏡像的管理 獲取鏡像并生成相關容器 # 拉取鏡像 docker pull alpine # 默認是latest&#xff0c;也就是最新版本&#xff0c;也可指定版本&#xff08;在鏡像名后邊加“:版本號”&#xff09; # 或者 # 從主機中導入鏡像到docker中 docker image load -i /test#生成容器 …

設計模式簡述(十九)橋梁模式

橋梁模式 描述基本組件使用 描述 橋梁模式是一種相對簡單的模式&#xff0c;通常以組合替代繼承的方式實現。 從設計原則來講&#xff0c;可以說是單一職責的一種體現。 將原本在一個類中的功能&#xff0c;按更細的粒度拆分到不同的類中&#xff0c;然后各自獨立發展。 基本…

ImportError: DLL load failed: 找不到指定的程序。

查看其他博客說是缺少libssl-1_1-x64.dll 和 libcrypto-1_1-x64.dll 然后去下載放到博客說的目錄下 沒有用 解決不了一點 OpenSSL for Windows 64位 完整安裝包 在這里 項目地址: https://gitcode.com/open-source-toolkit/eb627 注意事項 此安裝包僅適用于64位Windows系…

電池單元和電極性能

電芯設計中的挑戰 對于電池制造商來說&#xff0c;提高電池能量和功率密度至關重要。在高功率密度和長循環壽命之間取得平衡是電池設計中的關鍵挑戰&#xff0c;通常需要仔細優化材料、電極結構和熱管理系統。另一個關鍵挑戰是通過優化重量體積比來降低電池單元的總體成本。 工…

數據加密與隱私保護:讓你的信息固若金湯

數據加密與隱私保護:讓你的信息固若金湯 大家好,我是 Echo_Wish,今天聊聊一個 人人都關心、但很多人沒做好 的話題——數據加密與隱私保護的最佳實踐。 為什么要重視數據安全? 現在是數字化時代,從個人照片、銀行卡信息到企業機密,數據泄露的風險無處不在。你可能覺得自…

【高數上冊筆記篇02】:數列與函數極限

【參考資料】 同濟大學《高等數學》教材樊順厚老師B站《高等數學精講》系列課程 &#xff08;注&#xff1a;本筆記為個人數學復習資料&#xff0c;旨在通過系統化整理替代厚重教材&#xff0c;便于隨時查閱與鞏固知識要點&#xff09; 僅用于個人數學復習&#xff0c;因為課…

C++(8):類型限定符

目錄 1. const&#xff1a;定義常量 2. volatile&#xff1a;易變性修飾 3. restrict&#xff08;C非標準&#xff09; 4. mutable&#xff1a;突破常量性 5. static&#xff1a;靜態存儲 6. register&#xff08;已棄用&#xff09; 分類修正說明 1. const&#xff1a;…

Nginx yum 安裝

一、環境準備 一臺裝有 CentOS 7.9 的虛擬機 二、安裝 安裝 yum install -y nginx -y&#xff1a;所有的安裝選項都選擇 yes。 啟動 nginx systemctl enable nginx --now enable&#xff1a;設置 nginx 為開機啟動。--now&#xff1a;馬上啟動 nginx。 查看 nginx 服務狀態…

【5分鐘學Docker】Docker快速使用

目錄 1. 概述 2. 基本操作 2.1. 鏡像操作 2.2. 容器操作 2.3. 運行操作 2.4. 鏡像保存 2.5. 鏡像分享 3. 高級操作 4. 掛載 4.1. 目錄掛載 4.2. 卷映射 1. 概述 Docker 鏡像有鏡像名稱和TAG 2. 基本操作 2.1. 鏡像操作 查看鏡像 docker images docker image ls …

5000字總結 HTML5 中的音頻和視頻,關羽標簽、屬性、API 和最佳實踐

HTML5 音頻與視頻開發完全指南&#xff1a;標簽、屬性、API 與最佳實踐 一、引言&#xff1a;HTML5 媒體時代的到來 在 HTML5 之前&#xff0c;網頁中的音頻和視頻播放依賴 Flash、Silverlight 等第三方插件&#xff0c;存在兼容性差、性能瓶頸和安全隱患。HTML5 引入的 <…