從0開始學習計算機視覺--Day04--線性分類

從宏觀來看,卷積網絡可以看做是由一個個不同的神經網絡組件組合而成,就像積木一樣通過不同類型的組件搭建形成,其中線性分類器是一個很重要的組件,在很多卷積網絡中都有用到,所以了解清楚它的工作原理對我們后續的學習會有很大的幫助。線性分類器是參數模型中最簡單,最基礎的例子,下面我們用輸入圖片輸出圖片分類的模型的例子來更進一步地了解它。

首先,我們輸入一張圖片到模型中,輸入后我們就會得到f(x,W),x指的是參數,W指的是權重。緊接著通過模型的函數,將參數與權重帶入后會輸出10個數字,進而轉為圖片的類型。與之前用KNN算法進行圖片分類不同的是,在這個模型的例子中,不需要將訓練的數據集與測試集去一一比對找最相似的類別,相反我們只需要在測試時,有輸入圖片得到的參數和權重就可以知道圖片所屬的類型了,這也意味著這個模型可以適配在很多設備上,包括電腦甚至手機。對于深度學習的模型來說,函數的結構便是模型的核心功能,而在這個例子中,線性分類的函數形式就是最簡單的讓參數與權重相乘:F(X)=W*X。

那么,線性分類器的工作形式就很明顯了,假設圖片是22的圖像,我們把它拉伸為一個擁有四個元素的列向量,而W權重矩陣是一個3*4的矩陣,將矩陣與列向量進行點乘的運算,再加上為了平衡模型數據集造成的偏差的偏差向量,最終得到了三個類別(假設模型訓練時用的是三個類別的數據集)的得分,如下圖所示:

當然這里的權重矩陣是需要反向傳播和損失函數來確定的,這里只是為了方便理解線性分類器的過程而設置的一個隨機的3*4的矩陣。也可以理解為,權重矩陣就是模型對于某類圖片的認知,如果將W矩陣中的某個類比的行向量變形為輸入圖片的像素尺寸再可視化,就能觀察到在模型眼里這類圖片的“樣子”,比如汽車的圖片就是一片模糊中呈現一個類似于凸的輪廓。

線性分類器這種識別圖片的方法,有點類似于模版匹配,即模型對該類別圖片的理解來源于一個模版,如果給出的是貨車的圖片,模型會嘗試求可能得模型的輪廓并得出一個每個類別變體的平均值來作為答案,但這也會導致該類的行向量去判斷的準確率降低。如果把圖片看作高位空間的一個點(類似于平面圖中的一個點,在這里進行了一個同等的升維),線性分類器就是在嘗試用線將圖片區分開來,類似于在坐標系中,AX+B>0的范圍屬于A類圖片。這樣,就引出了它的弊端了,即存在很多不能分類的圖片,比如最簡單的在一個矩陣中,用橫豎兩條線切割成四塊,斜對角的為一個類別,那么不管怎么劃分線,一條線的另一端始終會有兩個種類的圖片。同樣的,另一類的存在范圍是以內切圓環或一個個圓的話,也是同樣區分不了的。在現實中,這指向的是我們的數據是多模態數據,某個類別會在不同的領域出現。

學習來自于斯坦福課程:Stanford University CS231n: Deep Learning for Computer Vision

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/88666.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/88666.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/88666.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于ComfyUI與Wan2.1模型的本地化視頻生成環境搭建指南

文章目錄 前言1.軟件準備1.1 ComfyUI1.2 文本編碼器1.3 VAE1.4 視頻生成模型2.整合配置3. 本地運行測試4. 公網使用Wan2.1模型生成視頻4.1 創建遠程連接公網地址5. 固定遠程訪問公網地址總結前言 各位小伙伴們,今天我們將為您展示一套創新的人工智能應用方案!本次教程將指導…

Vue 2 項目中內嵌 md 文件

推薦方案:raw-loader marked 解析 Markdown 第一步:安裝依賴 npm install marked --save npm install raw-loader --save-dev第二步:配置 webpack 支持 .md 文件 打開 vue.config.js 或 webpack.config.js,添加以下配置&#…

Spring AI初識及簡單使用,快速上手。

Spring AI簡介 在當今這樣一個快速發展的技術時代,人工智能(AI)已經成為各行各業的一種標配。而作為一款主流的Java應用開發框架Spring,肯定會緊跟時代的潮流,所以,推出了Spring AI框架。 官網描述&#…

Flask中的render_template與make_response:生動解析與深度對比

文章目錄 Flask中的render_template與make_response:生動解析與深度對比一、🌟 核心概念速覽二、� render_template - 網頁內容的主廚特點與內部機制適用場景高級用法示例 三、🎁 make_response - 響應的包裝專家核心功能解析適用…

WordPress目錄說明

在WordPress建站過程中,理解服務器目錄結構是非常重要的。以下是一個基礎的WordPress服務器目錄指南: /wp-admin/ :這個目錄包含了WordPress網站的所有管理功能,包括用于處理網站后臺的所有PHP文件。 /wp-includes/ :…

HTTP面試題——緩存技術

目錄 HTTP緩存技術有哪些? 什么是強制緩存? 什么是協商緩存? HTTP緩存技術有哪些? 對于一些具有重復性的HTTP請求,比如每次請求得到的數據都是一樣的,我們可以把這對 請求-響應的數據都緩存在本地&#x…

virtual box 不能分配 USB設備 IFX DAS JDS TriBoard TC2X5 V2.0 [0700] 到虛擬電腦 win10

VirtualBox: Failed to attach the USB device to the virtual machine – Bytefreaks.net ISSUE: virtual box 不能分配 USB設備 IFX DAS JDS TriBoard TC2X5 V2.0 [0700] 到虛擬電腦 win10. USB device IFX DAS JDS TriBoard TC2X5 V2.0 with UUID {91680aeb-e1…

Deepoc大模型重構核工業智能基座:混合增強架構與安全增強決策技術?

面向復雜系統的高可靠AI賦能體系構建 Deepoc大模型通過多維度技術突破&#xff0c;顯著提升核工業知識處理與決策可靠性。經核能行業驗證&#xff0c;其生成內容可驗證性提升68%&#xff0c;關鍵參數失真率<0.3%&#xff0c;形成覆蓋核能全鏈條的定制化方案&#xff0c;使企…

第12章:冰箱里的CT掃描儀——計算機視覺如何洞穿食材的“生命密碼“

第11章:冰箱里的CT掃描儀——計算機視覺如何成為食材健康的"超級診斷官" “糟了!冰箱里草莓長出了白色絨毛,雞胸肉滲出了可疑的粉紅色液體!” 這揭示了廚房生存的更基本挑戰:如何像經驗豐富的主廚一樣,一眼洞穿食材的健康密碼? 本章將揭示計算機視覺技術如何賦…

虛幻基礎:窗口——重定向

能幫到你的話&#xff0c;就給個贊吧 &#x1f618; 文章目錄 重定向&#xff1a;給骨架添加兼容骨架。使得不同模型間復用動畫資源 重定向&#xff1a;給骨架添加兼容骨架。使得不同模型間復用動畫資源

CSS 逐幀動畫

CSS 逐幀動畫實現指南 逐幀動畫(frame-by-frame animation)是一種通過快速連續顯示一系列靜態圖像來創造運動效果的技術。以下是使用CSS實現逐幀動畫的幾種方法。 1. 使用 steps() 計時函數 這是實現逐幀動畫最常用的方法&#xff0c;通過animation-timing-function的steps(…

高版本IDEA如何開發低版本jdk項目

問題描述 我這個人比較喜歡新的東西&#xff0c;比如使用idea的時候&#xff0c;我就喜歡最新版本。 但是有個問題&#xff0c;最新版本的idea好像不支持jdk1.6&#xff0c;導致我無法去用新版本idea開發項目。 直到有一天&#xff0c;idea給了我一個提示如下&#xff0c;之…

Java設計模式->責任鏈模式的介紹

目錄 1、責任鏈模式概念 1.1、定義介紹 1.2、流程圖 1.3、優缺點 2、實現 3、應用場景 3.1、Springmvc流程 3.2、mybatis的執行流程 3.3、Spring的過濾器和攔截器 3.4、sentinel限流熔斷 3.5、aop的加載和使用 4、舉例 前言 是一種 行為型設計模式&#xff0c;它通…

【Bluedroid】藍牙啟動之 btm_acl_device_down 流程源碼解析

本文詳細分析Android藍牙協議棧在設備故障時的處理流程。當藍牙設備發生硬件故障或系統異常時,協議棧通過btm_acl_device_down觸發多層次的資源清理和狀態重置,包括ACL連接終止、L2CAP通道釋放、SCO連接清理、BLE拓撲更新、設備數據庫重置等關鍵操作,確保系統安全恢復。 一、…

隨記:WebMvcConfigurationSupport 和WebMvcConfigurer 的區別

WebMvcConfigurationSupport &#xff08;抽象類&#xff09; 他是一個完整的 MVC 配置基類&#xff0c;他會禁用所有自動配置。默認靜態資源映射也沒有了。默認消息轉換器&#xff08;json、xml&#xff09;也沒有了。錯誤處理頁默認的error也沒有了。 WebMvcConfigurer &am…

npm run dev報錯

1. 引言 1.1 什么是npm run dev npm run dev 是一個在 Node.js 項目中常用的命令&#xff0c;它允許開發者運行一個預定義的腳本&#xff0c;通常用于啟動開發服務器或者執行開發環境的構建任務。這個命令是通過 package.json 文件中的 scripts 部分定義的&#xff0c;例如&…

Kotlin環境搭建與基礎語法入門

目標&#xff1a;完成開發環境配置&#xff0c;編寫第一個Kotlin程序&#xff0c;理解變量、數據類型和基本輸出。 1. 環境搭建 步驟1&#xff1a;安裝JDK 下載并安裝 JDK 17&#xff08;Kotlin兼容性最佳版本&#xff09;。 配置環境變量 JAVA_HOME&#xff0c;并在終端驗證…

CLion開發Qt桌面程序_git的簡單使用_小團體

OS&#xff1a;Windows Qt&#xff1a;6.8.1&#xff08;6.x&#xff09; Eg&#xff1a;學生信息管理系統 前言 Qt Creator編寫代碼不是太方便&#xff0c;使用CLion編寫代碼或許是個不錯的主意&#xff0c;CLion在此處主要是用于后端和測試的開發&#xff0c;界面方面還是…

C語言專題:8.函數指針(Function Pointer)

? 在 C 語言中&#xff0c;函數也是一種“對象”&#xff0c;它在內存中有地址。因此可以定義指向函數的指針&#xff0c;用于動態調用、回調處理、構建函數表等。 掌握函數指針是理解 C 語言“底層抽象”與“模塊化編程”的關鍵。 一、函數指針的基本概念 ? 函數指針是一個變…

快速傅里葉變換(FFT)是什么?

快速傅里葉變換(FFT)是什么&#xff1f; 快速傅里葉變換&#xff08;FFT&#xff09; 本質上是一種極其高效的算法&#xff0c;用來計算**離散傅里葉變換&#xff08;DFT&#xff09;**及其逆變換。它是數字信號處理、科學計算和工程應用中最重要的算法之一。 要理解 FFT&…