小模型學習(1)-人臉識別

????????

【寫作背景】因為最近一直在研究大模型,在與客戶進行交流時,如果要將大模型的變革性能力講清楚,就一定要能將AI小模型的一些原理和效果講清楚,進而形成對比。當然這不是一件簡單的事情,一方面大模型分析問題的的本質原理業界依然無法清楚解釋,另外一方面理解AI小模型原理本身也有一定門檻,但是我認為必須得試圖去理解這些問題。這個背景下,我找出了多年前買的一本《刷臉背后》的書籍重新學習,試圖從人臉識別這個場景去理解AI小模型處理問題的思路,進而找出大模型更好的解釋之道。

????????人臉識別包括三個基本步驟:

????????第一步:從圖像中檢索人臉邊框,所用的是人臉檢測技術。而人臉檢測技術有多種,可以基于膚色的,也可以基于人臉特征點(如眼睛)的方法,等等。

????????人臉檢測算法主要有DPM、LAEO、Viola&Jones算法,這些算法基本也是通過有標注的圖像訓練而來;也有基于深度學習的人臉檢測算法,如CNN Facial Point Detection人臉檢測算法,DDFD人臉檢測算法,以及多種算法的混合應用。(類似與當前大模型的MOE,混合專家模型)

????????【意外發現,DDFD人臉檢測算法是基于基于Alexnet進行微調改造而來的神經網絡模型,而Alexnet作為一種深度卷積神經網絡模型,其創始人居然是Alex Krizhevsky , Ilya Sutskever and Geoffrey Hinton。Ilya Sutskever 是誰?就是當前火爆的 OpenAI 的聯合創始人兼首席科學家,最近聯合董事會開除了OPEN AI CEO Sam Altman; Geoffrey Hinton就更厲害了,掃地僧,Ilya Sutskever 的博導)

????????第二步:是人臉區域的特征提取。根據算法原理和關注點的不同,人臉特征可以有很多種。深度學習特征是一種特征;還有Gabor,SIFT、HOG等多種特征提取方法。通過PCA、LDA等特征降維的方法得到特征,也可以作為人臉的特征;人臉面部的特征點信息,可以選取5個特征點(雙眼中心、鼻子、兩個嘴角),或2個特征點(包括眉梢、鼻端、下巴、雙眼中心、鼻子、兩個嘴角等信息),或30個乃至更多的特征點,每個特征點的位置和像素都可以用于表征人臉的特征。學術界已經有人臉特征點自動定位算法。 人臉特征提取方法,以及最后所使用的特征,對人臉識別的準確度具有關鍵作用。

????????第三步:是訓練識別人臉特征與人的標簽對應關系的分類模型。經過第二步,訓練圖像集中每個圖像都可以用一個特征向量來表示(如一個4096維的特征向量),最后加上該圖像的標簽(表示是那個人的人臉)。一個圖像對應一行類似與上面所屬的記錄,如果有m個訓練圖像,就得到m行這樣的記錄矩陣。然后,在該矩陣上,使用SVM,KNN,SOFTMAX regression,Logistic regression等方法訓練分類模型。利用最后得到的模型,預測測試圖像中每個圖像對應的人的標簽。

????????思考:上面人臉識別的三個步驟,可以簡單理解為先通過少量特征點找到人臉,然后通過算法提取每個人臉的特征,并用一組特征向量表示,且每個特征向量后面增加一個該人的姓名。比如

【A1,A2,A3,A4,A5,小明】,

如果有m個測試集,就會有一個行的矩陣,就類似構建了數據庫,接下來就是使用該數據庫。如何使用?把人臉輸入,通過特征提取算法提取該人臉的特征向量,然后通過計算與之前構建數據庫(就是那個m行的大矩陣)的歐式距離或者余弦相似度,從而找到輸入的人臉是誰。

????????可以發現,人臉識別的認證,首先必須構建一個全量的人臉特征向量數據庫,然后進行識別,那么這類應用其實之中識別已知的對象,對于不在特征庫里面的人臉,就沒法檢出,當然,在人臉識別認證這個場景不存在未知人臉,比如公安部門構建的人臉庫,不可能存在漏錄(每個人都用身份證)。

關于Alexnet:

?

經常問的問題

Q1.?AlexNet有什么用?

答:AlexNet 是一種開創性的卷積神經網絡 (CNN),主要用于圖像識別和分類任務。它在2012年贏得了ImageNet大規模視覺識別挑戰賽,標志著深度學習的突破。AlexNet 的架構憑借其對卷積層和修正線性單元 (ReLU) 的創新使用,為現代深度學習模型奠定了基礎,推動了計算機視覺和模式識別應用的發展。

Q2。為什么 AlexNet 比 CNN 更好?

A. AlexNet是CNN的一種特定類型,是一種特別擅長理解圖像的神經網絡。當 AlexNet 被引入時,它在識別圖片中的物體方面表現出了令人印象深刻的結果。它變得流行是因為它更深(有更多層)并使用一些聰明的技巧來提高準確性。所以,AlexNet并不比CNN更好;它是一種 CNN,對使 CNN 在圖像相關任務中流行起來具有重要影響。

尾注

快速總結我們在本文中看到的架構。

  • 它有 8 層,具有可學習的參數。
  • 模型的輸入是 RGB 圖像。
  • 它有 5 個卷積層和最大池化層的組合。
  • 然后它有 3 個全連接層。
  • 所有層使用的激活函數是Relu。
  • 它使用了兩個 Dropout 層。
  • 輸出層使用的激活函數是Softmax。
  • 該架構中的參數總數為 6230 萬個。

參考:

1、《刷臉背后》張重生。

2、【人工智能】回顧人工智能十年發展歷程 | 2013-2023 | AlexNet | GAN | Transformer | Resnet | GNN | GPT | Stable Diffusion


3、Introduction to The Architecture of Alexnet?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/212188.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/212188.shtml
英文地址,請注明出處:http://en.pswp.cn/news/212188.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Mybatis分頁插件PageHelper

PageHelper是什么&#xff1f; 是MyBatis提供的分頁插件&#xff0c;可以支持MySQL、Oracle等六種數據庫。 集成方式如下&#xff1a; 1 引入依賴 <!-- https://mvnrepository.com/artifact/com.github.pagehelper/pagehelper --> <dependency><groupId>co…

反射加載SDK完成統一調用

文章目錄 1、需求背景2、接口抽象類具體實現類3、疑問4、存在的問題5、通過反射加載SDK并完成調用5、補充&#xff1a;關于業務網關7、補充&#xff1a;關于SDK的開發 關鍵點&#xff1a; 接口抽象類&#xff08;半抽象半實現&#xff09;具體實現類業務網關反射加載SDK&#…

JAVA如何調用python

以下代碼想通過測試&#xff0c;必須有一個前提&#xff1a;電腦上安裝了Python環境。不太習慣說廢話&#xff0c;直接上代碼了。 以下是用于測試的python代碼&#xff08;mytest.py&#xff09;&#xff1a; # 因為用戶到了參數處理&#xff0c;所以需要引用 import argpars…

Java學習手冊——第五篇數據類型

數據類型&#xff1a;是數據化的基石&#xff0c;如果沒有數據類型怎么表示呢&#xff1f;比如年齡可以用整數&#xff1a;18歲。如果有更好的表示方式大家可以留言喲~ 在舉個例子就是姓名&#xff0c;我們需要用字符串的形式來表示。這就是數據類型的魅力&#xff0c;而又有同…

TS基礎語法

前言&#xff1a; 因為在寫前端的時候&#xff0c;發現很多UI組件的語法都已經開始使用TS語法&#xff0c;不學習TS根本看不到懂&#xff0c;所以簡單的學一下TS語法。為了看UI組件的簡單代碼&#xff0c;不至于一臉懵。 一、安裝node 對于windows來講&#xff0c;node版本高…

電腦出現這些現象,說明你的固態硬盤要壞了

與傳統機械硬盤&#xff08;HDD&#xff09;相比&#xff0c;固態硬盤&#xff08;SSD&#xff09;速度更快、更穩定、功耗更低。但固態硬盤并不是完美無瑕的&#xff0c;由于顆粒寫入機制&#xff0c;可能會在七到十年的預期壽命之前出現故障。所以用戶最好為最終故障做好準備…

網頁設計中增強現實的興起

目錄 了解增強現實 增強現實的歷史背景 AR 和網頁設計的交叉點 AR 在網頁設計中的優勢 增強參與度和互動性 個性化的用戶體驗 競爭優勢和品牌差異化 AR 在網頁設計中的用例 結論 近年來&#xff0c;增強現實已成為一股變革力量&#xff0c;重塑了我們與數字領域互動的方式。它被…

【FMCW毫米波雷達設計 】 — FMCW波形

原書&#xff1a;FMCW Radar Design 1 引言 本章研究驅動FMCW雷達的主要波形:線性調頻(LFM)波形。我們研究信號的行為及其性質。隨后&#xff0c;本章討論了匹配濾波理論&#xff0c;并研究了壓縮這種波形的技術&#xff0c;特別是所謂的拉伸處理&#xff0c;它賦予FMCW雷達極…

DOS 批處理 (二)

DOS 批處理 1. 基礎 DOS 命令1.1 基礎命令1.2 文件系統操作1.3 文件夾管理1.4 文件管理1.5 網絡相關1.6 系統管理1.7 IF、FOR和NETIFFORNET 1. 基礎 DOS 命令 command /? 查找幫助DOS命令不區分命令字母的大小寫 C:\Users\Administrator>echo 1 1 C:\Users\Administrator…

基于SSM框架的倉庫管理系統

基于SSM框架的倉庫管理系統 文章目錄 基于SSM框架的倉庫管理系統 一.引言二.系統設計三.技術架構四.功能實現五.界面展示六.源碼獲取 一.引言 現代商業環境中&#xff0c;倉庫管理對于企業的運營效率和客戶滿意度至關重要。傳統的手工管理方式已經無法滿足日益復雜的倉儲需求。…

【Spring】SpringBoot日志

SpringBoot日志 日志概述日志使用打印日志獲取日志對象使用日志對象打印日志日志框架介紹門面模式SLF4J框架介紹(simple logging facade for java) 日志格式說明日志級別日志級別的分類日志級別的使用 日志配置配置日志級別日志持久化配置日志文件的路徑和文件名配置日志文件的…

【刷題篇】動態規劃(六)

文章目錄 1、最大子數組和2、環形子數組的最大和3、乘積最大子數組4、乘積為正數的最長子數組長度5、 等差數列劃分6、最長湍流子數組 1、最大子數組和 給你一個整數數組 nums &#xff0c;請你找出一個具有最大和的連續子數組&#xff08;子數組最少包含一個元素&#xff09;&…

【Unity動畫】Avatar Mask

創建 Avatar Mask可以設置那一部分骨骼運動和不運動 然后放在狀態機里面的層中來混合 【后續完善】

深入探索 Rust 宏編程

Rust 宏提供了一種強大的方法來編寫抽象和重用代碼,它們在 Rust 編程中扮演著重要的角色。本文將深入探索 Rust 宏的概念、類型、使用方法以及如何實現自定義宏,以提供一個全面的 Rust 宏編程指南。 Rust 宏簡介 宏是 Rust 中的一種元編程工具,它們在編譯時運行,用于生成…

linux安裝node

文章目錄 安裝node 安裝node 一次手操記錄 - 首先安裝wget yum install -y wget - 下載nodejs最新的tar包 wget https://cdn.npm.taobao.org/dist/node/v12.12.0/node-v12.12.0-linux-x64.tar.xz - 解壓包 tar -xvf node-v12.12.0-linux-x64.tar.xz - 部署bin文件 先確認你no…

30 張圖解 HTTP 常見的面試題

前言 在面試過程中&#xff0c;HTTP 被提問的概率還是比較高的 我搜集了 5 大類 HTTP 面試常問的題目&#xff0c;同時這 5 大類題跟 HTTP 的發展和演變關聯性是比較大的&#xff0c;通過問答 圖解的形式由淺入深的方式幫助大家進一步的學習和理解 HTTP 協議。 HTTP 基本概…

第四節JavaScript 條件語句、循環語句、break與continue語句

一、JavaScript條件語句 在通常的代碼中&#xff0c;我們有一些需要決定執行不同動作&#xff0c;這就可以在代碼中使用條件語句來完成。 下面是我們常使用的條件語句&#xff1a; if語句&#xff1a;只有當指定條件是true時&#xff0c;執行條件內代碼。if…else語句&#…

JavaScript數組的長度

JavaScript數組的長度可以通過數組對象的length屬性來獲取&#xff0c;長度表示數組中元素的數量。 代碼示例&#xff1a; let arr []; // 定義一個空數組 console.log(arr.length); // 輸出 0arr.push(1); // 給數組添加元素 arr.push(2); arr.push(3); console.log(arr.le…

項目二 創建與操作學生管理數據庫

項目二 創建與操作學生管理數據庫 #目標 創建庫&#xff1b;查看庫&#xff1b;操作庫&#xff1b;圖形工具操作庫1&#xff0c;創建學生管理數據庫 #創建數據庫 CREATE DATABASE [IF NOT EXISTS] db_name [[DEFAULT] CHARACTER SET charset_name] [[DEFAULT] COLLATE collat…

44.0/認識前端

44.1 目錄 44.1.1 網頁 44.1.1.1 網頁的組成 44.1.1.2 網頁的分類 44.1.2 網站 44.1.2.1 網站的分類 44.1.3 主頁 44.2. Internet、IP 地址和域名 44.2.1 Internet 44.2.2 IP 44.2.3 域名 44.3. Web 前端技術概述 44.3.1 html5 44.3.2 CSS3 44.3.3 Javascript …