人臉識別——探索戴口罩對人臉識別算法的影響

1. 概述

人臉識別是一種機器學習技術,廣泛應用于各種領域,包括出入境管制、電子設備安全登錄、社區監控、學校考勤管理、工作場所考勤管理和刑事調查。然而,當 COVID-19 引發全球大流行時,戴口罩就成了日常生活中的必需品。廣泛使用的人臉識別技術受到嚴重影響,傳統人臉識別技術的性能顯著下降。雖然在過去幾年中已有報道稱支持口罩的人臉識別模型達到了一定的準確度,但佩戴口罩對人臉識別的影響尚未得到充分研究。
因此,本文比較并評估了多種人臉識別模型在辨別 "蒙蔽 "和 "未蒙蔽 "人臉圖像時的性能。本文使用了六種傳統的機器學習算法:支持向量機(SVC)、K 近鄰(KNN)、線性判別分析(LDA)、決策樹(DT)、邏輯回歸(LR)和天真貝葉斯(NB)。(深度學習模型尚未經過驗證)。
它研究了蒙面人臉圖像的最佳和最差性能模型。論文還根據一個蒙面和未蒙面人臉圖像數據集以及一個半蒙面人臉圖像數據集對性能進行了評估。與以往的研究相比,本文的獨特之處在于研究了廣泛的面具佩戴數據和機器學習模型。
論文地址:https://arxiv.org/pdf/2306.08549.pdf

2. 機器學習模型和數據集

本文評估了六種模型:支持向量機(SVC/Support Vector Classifier)、線性判別分析(LDA/Linear Discriminant Analysis)、K-近鄰(KNN/K-Nearest Neighbours)、決策樹(DT/Decision Trees)、邏輯回歸(LR/Logistic Regression)和奈夫貝葉斯(NB/Na?ve Bayes)。(DT/決策樹)、邏輯回歸(LR/邏輯回歸)和奈夫貝葉斯(NB/奈夫貝葉斯)。

該數據集還使用了 (ORL),其中包含 41 個受試者和每個受試者 10 張圖像,共計 410 張未掩蓋的人臉圖像。下圖顯示了 ORL 的樣本數據。

本文使用開源軟件 MaskTheFace 為 ORL 人臉圖像添加面具,并制作出佩戴面具的人臉圖像。佩戴的面具是從六個面具模板中隨機選擇并添加的。下圖顯示了添加面具后的樣本數據。

2. 實驗細節

本文使用上述機器學習模型和數據集進行了六項實驗。請注意,在所有實驗中,特征提取都使用了局部二進制模式(LBP)算法。

**(實驗 1)**在為 41 名受試者每人準備的 10 幅圖像中,有 9 幅被用作未戴面罩的人臉圖像,并對 6 個機器學習模型進行訓練。在為 41 名受試者每人準備的 10 張圖像中,剩下的一張也用作無遮罩的人臉圖像,并對每個機器學習模型進行測試。

(實驗 2)在為 41 名受試者每人準備的 10 張圖像中,9 張作為未戴面罩的人臉圖像用于訓練 6 個機器學習模型。在為 41 名受試者每人準備的 10 張圖像中,剩下的一張圖像將與 MaskTheFace 一起使用,作為戴面具的人臉圖像對每個模型進行測試。圖 3

(實驗 3)在為 41 名受試者每人準備的 10 幅圖像中,有 9 幅被用作戴了面具的人臉圖像,并訓練了 6 個機器學習模型。在為 41 名受試者每人準備的 10 張圖像中,剩下的一張也被用作無面具人臉圖像,用于測試每個機器學習模型。

(實驗 4)在為 41 名受試者每人準備的 10 幅圖像中,有 9 幅被用作戴上面具后的人臉圖像,并訓練了 6 個機器學習模型。然后,使用 MaskTheFace 將為 41 名受試者分別準備的 10 幅圖像中的其余一幅圖像作為戴上面具的人臉圖像,對每個模型進行測試。圖 4

(實驗 5)在為 41 名受試者每人準備的 10 幅圖像中,保留一幅圖像用于測試,其余 9 幅圖像中的 4 幅在 MaskTheFace 軟件中組合為戴面具的人臉圖像,4 幅為未戴面具的人臉圖像,總共 8 幅人臉圖像。這樣就形成了一個半數人臉圖像戴有面具的數據集。利用這個數據集,可以訓練出六個機器學習模型,每個模型都要在一張未戴面具的人臉圖像上進行測試。

**(實驗 6)**使用實驗 5 中創建的數據集訓練了六個機器學習模型,該數據集由半張被遮擋的人臉圖像組成,每個模型都在單張被遮擋的人臉圖像上進行了測試。圖 5

3. 實驗結果

下表顯示了六個機器學習模型在所有六個實驗中的準確率。對于在未屏蔽人臉圖像(UM)上訓練并在屏蔽人臉圖像(M)上測試的機器學習模型(UM/M),LDA 的準確率下降幅度最小,為 61%,而 KNN 的準確率下降幅度最大,為 24%。還可以看出,對于在蒙版人臉圖像(M)上訓練并在蒙版圖像(M)上測試的機器學習模型,LR 的準確率最高,為 80%,而 KNN 的準確率最低,為 37%。

下表顯示了六種機器學習模型在所有六次實驗中的 F1 分數。對于在未遮擋人臉圖像(UM)上訓練并在遮擋人臉圖像(M)上測試的機器學習模型,LDA 的 F1 分數最高,為 76%,KNN 的分數最低,為 39%。而對于一半在蒙蔽人臉圖像(HM)上訓練,一半在蒙蔽圖像(M)上測試的模型,LR 的 F1 得分最高,為 89%,KNN 的得分最低,為 54%。在蒙蔽圖像(M)上訓練并在蒙蔽圖像(M)上測試的模型中,LR 的 F1 得分最高,為 89%,DT 的得分最低,為 54%。

回顧下表(再次),我們可以看到,在未蒙面的人臉圖像(UM)上訓練和在未蒙面的人臉圖像(UM)上測試時,最佳平均性能為 81%。這是很自然的結果,因為機器學習模型是基于人臉圖像沒有戴面具這一假設建立的。另一方面,當模型在未戴面具的人臉圖像上訓練并在戴面具的人臉圖像上測試時,平均性能最低,僅為 45%。這表明,正如 Corona 災難所報告的那樣,在未戴面具的人臉圖像上訓練的模型并不適合識別戴面具的人臉圖像。這與已報告的結果具有可重復性。

我們還發現,如果在一個由不戴面具的人臉圖像或一半戴面具的人臉圖像組成的數據集上進行訓練,機器學習模型在蒙面人臉圖像測試中的平均準確率會下降。如果機器學習模型在戴了面具的人臉圖像上進行訓練,則測試戴了面具的人臉圖像的準確率會提高。

上表還顯示,在所有三種類型的訓練數據上,LR 在識別未蒙蔽人臉圖像方面都優于其他模型。當在帶有遮擋或半遮擋圖像的數據集上進行訓練時,LR 在識別遮擋圖像方面優于其他模型。

對于需要識別遮擋和未遮擋面部圖像的系統來說,最好在由半遮擋面部圖像組成的數據集上進行訓練,并使用 LR,如上表所示。

4. 總結

本文為了研究戴面具對機器學習模型的影響,使用支持向量機(SVC/Support Vector Classifier)、線性判別分析(LDA/Linear Discriminant Analysis)、K-近鄰(KNN/K-Nearest NeighboursSVC/Support Vector Classifier)、線性判別分析(LDA/Linear Discriminant Analysis)、K-Nearest Neighbours(KNN/K-Nearest Neighbours)、決策樹(DT/Decision Trees)、邏輯回歸(Logistic Regression (LR/Logistic Regression)和奈夫貝葉斯(NB/Na?ve Bayes),并使用六種機器學習模型進行了詳盡的實驗。

實驗結果表明,在 "半遮擋和半未遮擋面部圖像數據集 "上進行訓練時,LR 作為同時識別遮擋和未遮擋面部圖像的系統表現最佳。

在識別被遮擋的人臉圖像時,在更多被遮擋的人臉圖像上訓練的模型的準確率呈上升趨勢,但與此同時,在識別未被遮擋的圖像時,準確率呈下降趨勢。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/19299.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/19299.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/19299.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

反射機制大揭秘-進階Java技巧,直擊核心!

反射在Java中扮演著重要的角色,掌握了反射,就等于掌握了框架設計的鑰匙。本文將為您逐步講解反射的基本概念、獲取Class對象的三種方式、使用反射實例化對象并操作屬性和方法,還有解析包的相關內容。跟隨我一起探索反射的奧秘,提升…

使用 Ubuntu + Docker + Vaultwarden + Tailscale 自建密碼管理器

使用 Ubuntu Docker Vaultwarden Tailscale 自建密碼管理器 先決條件 一臺運行 Ubuntu 系統的服務器。可以是云提供商的 VPS、家庭網絡中的樹莓派、或者 Windows 電腦上的虛擬機等等 一個 Tailscale 賬戶。如果還沒有 Tailscale 賬戶,可以通過此鏈接迅速創建一個…

SelfKG論文翻譯

SelfKG: Self-Supervised Entity Alignment in Knowledge Graphs SelfKG:知識圖中的自監督實體對齊 ABSTRACT 實體對齊旨在識別不同知識圖譜(KG)中的等效實體,是構建網絡規模知識圖譜的基本問題。在其發展過程中,標…

華納云:MAC電腦怎么遠程連接Windows服務器桌面?

在Mac電腦上遠程連接Windows服務器桌面可以通過多種方式實現,最常用的方法是使用微軟提供的免費應用程序 "Microsoft Remote Desktop"。以下是詳細的步驟來設置和使用該工具: 步驟一:下載和安裝 Microsoft Remote Desktop 打開App …

SpringBoot的自動裝配

我們今天再來說一下關于 SpringBoot 的自動裝配,為什么會有這樣的問題呢?一般這種情況都是在面試的過程中,面試官有時候會問到這個問題,就比如從開始問SpringBoot 的一些常用注解,到SpringBoot的一些特性,然…

zynq之UART

之前嘗試UART0(MIO50、51),串口調試助手收到發送的內容。 現在板子上EMIO端有多個串口,所以看看這個怎么弄。 串口是484的轉接板(接232的串口就會輸出亂碼) https://blog.51cto.com/u_15262460/2882973 …

【九十三】【算法分析與設計】719. 找出第 K 小的數對距離,N 臺電腦的最長時間,二分答案法

719. 找出第 K 小的數對距離 - 力扣&#xff08;LeetCode&#xff09; 數對 (a,b) 由整數 a 和 b 組成&#xff0c;其數對距離定義為 a 和 b 的絕對差值。 給你一個整數數組 nums 和一個整數 k &#xff0c;數對由 nums[i] 和 nums[j] 組成且滿足 0 < i < j < nums.le…

java調用遠程接口下載文件

在postman中這樣下載文件 有時下載文件太大postman會閃退&#xff0c;可以通過代碼下載&#xff0c;使用hutool的http包

3步操作助您輕松實現蘋果手機照片一鍵傳輸至電腦

對于很多使用蘋果手機的用戶來說&#xff0c;隨著手機中照片和視頻數量的不斷積累&#xff0c;如何將這些珍貴的回憶從手機轉移到電腦&#xff0c;以便更好地保存、整理和分享&#xff0c;成為了一個值得關注的問題。那么&#xff0c;蘋果手機怎么把照片導入電腦呢&#xff1f;…

鴻蒙課程培訓 | 訊方技術與鴻蒙生態服務公司簽約,成為鴻蒙鉆石服務商

3月15日&#xff0c;深圳市訊方技術股份有限公司與鴻蒙生態服務公司簽署合作協議&#xff0c;訊方技術成為鴻蒙鉆石服務商&#xff0c;正式進軍鴻蒙原生應用培訓開發領域。訊方技術總裁劉國鋒、副總經理劉銘皓、深圳區域總經理張松柏、深圳區域交付總監張梁出席簽約儀式。 作…

鄉村振興的鄉村產業創新發展:培育鄉村新興產業,打造鄉村產業新名片,促進鄉村經濟多元化發展

目錄 一、引言 二、鄉村產業創新發展的必要性 &#xff08;一&#xff09;適應新時代發展要求 &#xff08;二&#xff09;滿足消費升級需求 &#xff08;三&#xff09;促進農民增收致富 三、培育鄉村新興產業策略 &#xff08;一&#xff09;加強科技創新引領 &#…

在 MFC 中 UNICODE 加 _T 與 L 長字符串,有什么區別?

在MFC&#xff08;Microsoft Foundation Classes&#xff09;和更廣泛的Windows編程環境中&#xff0c;UNICODE宏用于指示程序應使用Unicode字符集&#xff08;通常是UTF-16&#xff09;來處理文本。當定義了UNICODE宏時&#xff0c;編譯器和庫函數會期待和處理寬字符&#xff…

Android下HWC以及drm_hwcomposer普法((上)

Android下HWC以及drm_hwcomposer普法((上) 引言 按摩得全套&#xff0c;錯了&#xff0c;做事情得全套&#xff0c;普法分析也是如此。drm_hwcomposer如果對Android圖形棧有一定研究的童鞋們應該知道它是Android提供的一個的圖形后端合成處理HAL模塊的實現。但是在分析這個之前…

Java復習-集合篇

集合 集合分為倆大類 單列集合 每個元素數據只包含一個值 雙列集合 每個元素包含倆個鍵值對 Conllection單列集合 單列集合常用的主要是下列幾種 List集合 List系列集合的特點&#xff1a;添加元素是有序、可重復、有索引 這里我們來試一下ArrayList ArrayList<String&g…

Spring OAuth2:開發者的安全盾牌!(上)

何利用Spring OAuth2構建堅不可摧的安全體系&#xff1f;如何使用 OAuth2 從跨域挑戰到性能優化&#xff0c;每一個環節都為你的應用保駕護航&#xff1f; 文章目錄 Spring OAuth2 詳解1. 引言簡述OAuth2協議的重要性Spring Framework對OAuth2的支持概述 2. 背景介紹2.1 OAuth2…

比較Rust和Haskel

在比較Rust和Haskell時&#xff0c;我們可以從多個維度來分析它們各自的優勢。以下是Rust相對于Haskell的優勢&#xff0c;以及Haskell相對于Rust的優勢&#xff1a; Rust比Haskell強的方面&#xff1a; 內存安全與并發性&#xff1a; Rust通過獨特的所有權系統和借用檢查器在…

智能倉儲物流系統(WMS)系列-管理查詢調整

好的應用系統應是細分簡單&#xff0c;界面簡潔易操作&#xff0c;程序代碼簡潔易懂的。

史上最全排序算法整理(2)

本篇文章我們將接著上篇繼續介紹常見的排序算法&#xff0c;有需要的小伙伴可以移步史上最全排序算法整理&#xff08;1&#xff09;查看相關內容哦 1.冒泡排序 1.1基本思想 在待排序的一組數中&#xff0c;將相鄰的兩個數進行比較&#xff0c;若前面的數比后面的數大就交換兩…

【解決npm install -g windows-build-tools的安裝問題】

解決npm install -g windows-build-tools的安裝問題 https://developer.huawei.com/consumer/cn/forum/topic/0203740461436730610?fid26

gitlab 創建 ssh 和 token

文章目錄 一、創建ssh key二、將密鑰內容復制到gitlab三、創建token 一、創建ssh key 打開控制臺cmd&#xff0c;執行命令 ssh-keygen -t rsa -C xxxxx xxxxx是你自己的郵箱 C:\Users\xx\.ssh 目錄下會創建一個名為id_rsa.pub的文件&#xff0c;用記事本打開&#xff0c;并…