嵌入式人工智能應用-第6章 人臉檢測

嵌入式人工智能應用

人臉檢測

  • 嵌入式人工智能應用
  • 1 人臉檢測
    • 1.1 CNN 介紹
    • 1.2 人臉檢測原理
    • 1.3 MTCNN介紹
    • 1.4 NCNN介紹
    • 2 系統安裝
    • 2.1 安裝依賴庫NCNN
    • 2.2 運行對應的庫
  • 3 總結

1 人臉檢測

1.1 CNN 介紹

卷積神經網絡。卷積是什么意思呢?從數學上說,卷積是一種運算。它是我們學習高等數學之后新接觸的一種運算。在泛函分析中,卷積、旋積或摺積(英語:Convolution)是通過兩個函數 f 和 g 生成第三個函數的一種數學算子,表征函數 f 與 g 經過翻轉和平移的重疊部分函數值乘積對重疊長度的積分。

卷積神經網絡聽起來像是一個奇怪的生物學和數學的結合,但是這些網絡已經成為計算機視覺領域最具影響力的創新之一。2012 年是神奇網絡成長的第一年,Alex Krizhevsky 用它們贏得了當年的 ImageNet競賽(基本上是計算機視覺年度奧運會),把分類錯誤記錄從 26%降到了 15%,這個驚人的提高從那以后,許多公司一直在以服務為核心進行深度學習。Facebook 使用自動標記算法的神經網絡,谷歌的照片搜索,亞馬遜的產品推薦,Pinterest 的家庭飼料個性化和 Instagram 的搜索基礎設施。

卷積神經網路(Convolutional Neural Network, CNN)是一種前饋神經網絡,它的人工神經元可以響應一部分覆蓋范圍內的周圍單元,對于大型圖像處理有出色表現。卷積神經網路由一個或多個卷積層和頂端的全連通層(對應經典的神經網路)組成,同時也包括關聯權重和池化層(pooling layer)。這一結構使得卷積神經網路能夠利用輸入數據的二維結構。與其他深度學習結構相比,卷積神經網路在圖像和語音識別方面能夠給出更好的結果。這一模型也可以使用反向傳播算法進行訓練。相比較其他深度、前饋神經網路,卷積神經網路需要考量的參數更少,使之成為一種頗具吸引力的深度學習結構。 卷積網絡是一種專門用于處理具有已知的、網格狀拓撲的數據的神經網絡。

1.2 人臉檢測原理

人臉檢測的目標是找出圖像中所有的人臉對應的位置,算法的輸出是人臉外接矩形在圖像中的坐標,可能還包括姿態如傾斜角度等信息。雖然人臉的結構是確定的,由眉毛、眼睛、鼻子和嘴等部位組成,近似是一個剛體,但由于姿態和表情的變化,不同人的外觀差異,光照,遮擋的影響,準確的檢測處于各種條件下的人臉是一件相對困難的事情。

簡單敘述,人臉檢測的難點在于:人臉可能出現在圖像中的任何一個位置;人臉可能有不同的大小;人臉在圖像中可能有不同的視角和姿態;人臉可能部分被遮擋。由于人臉可能出現在圖像的任何位置,在檢測時用固定大小的窗口對圖像從上到下、從左到右掃描,判斷窗口里的子圖像是否為人臉,這稱為滑動窗口技術(sliding window)。為了檢測不同大小的人臉,還需要對圖像進行放大或者縮小構造圖像金字塔,對每張縮放后的圖像都用上面的方法進行掃描。由于采用了滑動窗口掃描技術,并且要對圖像進行反復縮放然后掃描,因此整個檢測過程會非常耗時。

人臉檢測是計算機視覺領域被深入研究的經典問題,在安防監控、人證比對、人機交互等領域都有重要的應用價值。數碼相機、智能手機等端上的設備已經大量使用人臉檢測技術實現成像時對人臉的對焦、圖集整理分類等功能,各種虛擬美顏相機也需要人臉檢測技術定位人臉,然后才能根據人臉對齊的技術確定人臉皮膚、五官的范圍然后進行美顏。在人臉識別的流程中,人臉檢測是整個人臉識別算法的第一步。

1.3 MTCNN介紹

MTCNN,Multi-task convolutional neural n

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/897276.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/897276.shtml
英文地址,請注明出處:http://en.pswp.cn/news/897276.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

RocketMQ提供了哪些過濾機制?

前言 本篇文章比較簡單,分別介紹RocketMQ支持幾種過濾機制,其原理和使用。 RocketMQ 提供了多種消息過濾機制,幫根據業務需求高效篩選消息,可以減少不必要的消息傳輸和處理。以下是其核心過濾機制及使用場景: 1. Tag…

Redis數據結構深度解析:從String到Stream的奇幻之旅(一)

Redis系列文章 《半小時掌握Redis核心操作:從零開始的實戰指南》-CSDN博客 Redis數據結構深度解析:從String到Stream的奇幻之旅(一)-CSDN博客 Redis數據結構深度解析:從String到Stream的奇幻之旅(二&…

【Java開發指南 | 第三十五篇】Maven + Tomcat Web應用程序搭建

讀者可訂閱專欄:Java開發指南 |【CSDN秋說】 文章目錄 前言Maven Tomcat Web應用程序搭建1、使用Maven構建新項目2、單擊項目,連續按兩次shift鍵,輸入"添加",選擇"添加框架支持"3、選擇Java Web程序4、點擊&…

機器始終是一個機器:技術本質與哲學邊界

機器始終是一個機器:技術本質與哲學邊界 這句話揭示了人工智能發展中的核心矛盾——無論技術如何進步,機器的本質仍是基于規則與數據的計算系統。這種「機器性」既是其能力的源泉,也是其與生命體智能不可逾越的邊界的根源。以下從技術本質、…

JAVA編程【jvm垃圾回收的差異】

jvm垃圾回收的差異 JVM(Java Virtual Machine)的垃圾回收(GC)機制是自動管理內存的一種方式,能夠幫助開發者釋放不再使用的內存,避免內存泄漏和溢出等問題。不同的垃圾回收器(GC)有…

親測解決筆記本觸摸板使用不了Touchpad not working

這個問題可以通過FnFxx來解決,筆記本鍵盤上Fxx會有一個觸摸板圖標。如果不行應該玉藻設置中關了,打開即可。 解決辦法 在藍牙,觸摸板里打開即可。 Turn it on in settings。

RAG技術深度解析:從基礎Agent到復雜推理Deep Search的架構實踐

重磅推薦專欄: 《大模型AIGC》 《課程大綱》 《知識星球》 本專欄致力于探索和討論當今最前沿的技術趨勢和應用領域,包括但不限于ChatGPT和Stable Diffusion等。我們將深入研究大型模型的開發和應用,以及與之相關的人工智能生成內容(AIGC)技術。通過深入的技術解析和實踐經…

數據結構篇——串(String)

一、引入 在計算機中的處理的數據內容大致可分為以整形、浮點型等的數值處理和字符、字符串等的非數值處理。 今天我們主要學習的就是字符串數據。本章主要圍繞“串的定義、串的類型、串的結構及其運算”來進行串介紹與學習。 二、串的定義 2.1、串的基本定義 串(s…

【智能體架構:Agent】LangChain智能體類型ReAct、Self-ASK的區別

1. 什么是智能體 將大語言模型作為一個推理引擎。給定一個任務, 智能體自動生成完成任務所需步驟, 執行相應動作(例如選擇并調用工具), 直到任務完成。 2. 先定義工具:Tools 可以是一個函數或三方 API也…

OmniParser技術分析(一)

1.引言 通過上篇文章介紹 OmniParser:下一代純視覺UI自動化測試先驅相信大家已經對OmniParser有初步了解,接下來詳細介紹下OmniParser使用了哪些技術模型實現了對UI純視覺的檢測和理解。 2.整體方案 通過閱讀OmniParser提供的運行Demo代碼知道,其實整…

設計心得——繼承和實例

一、繼承的應用場景 在上篇文章分析了繼承的應用,本文反過來講繼承和實例。可以理解對上文的繼承進行一下基礎知識的鋪墊,繼承的應用場景非常多,典型的應用場景包括: 1、單純屬性的繼承 這種繼承非常常見,在前面也舉過…

從連接到交互:SDN 架構下 OpenFlow 協議的流程與報文剖析

在SDN架構中,交換機與控制器之間的通信基于 OpenFlow協議,其設計目的是實現控制平面與數據平面的解耦。以下是 交換機連接控制器 和 數據包進入交換機觸發交互 的詳細流程及協議報文分析: 一、交換機連接控制器的流程(初始化階段&…

opentitan riscv

OpenTitan?是一個開源的硅根信任(Root of Trust, RoT)項目,旨在使硅RoT的設計和實現更加透明、可信和安全,適用于企業、平臺提供商和芯片制造商。該項目由lowRISC CIC管理,作為一個協作項目,旨在生產高質量…

R語言使用scitable包交互效應深度挖掘一個陌生數據庫

很多新手剛才是總是覺得自己沒什么可以寫的,自己不知道選什么題材進行分析,使用scitable包后這個完全不用擔心,選題多到你只會擔心你寫不完,寫得不夠快。 今天演示一下使用scitable包深度挖掘一個陌生數據庫 先導入R包和數據 li…

電腦內存智能監控清理,優化性能的實用軟件

軟件介紹 Memory cleaner是一款內存清理軟件。功能很強,效果很不錯。 Memory cleaner會在內存用量超出80%時,自動執行“裁剪進程工作集”“清理系統緩存”以及“用全部可能的方法清理內存”等操作,以此來優化電腦性能。 同時,我…

C#控制臺應用程序學習——3.8

一、語言概述 1、平臺相關性 C# 主要運行在.NET 平臺上。.NET 提供了一個龐大的類庫,C# 程序可以方便地調用這些類庫來實現各種功能,如文件操作、數據庫訪問、網絡通信等。 2、語法風格 C# 的語法與 C、C 和 Java 有一定的相似性。例如,它使用…

鴻蒙HarmonyOS-Navagation基本用法

Navagation基本用法 Navigation組件是路由導航的根視圖容器,一般作為Page頁面的根容器使用,其內部默認包含了標題欄,內容欄和公工具欄,其中內容區默認首頁顯示導航內容(Navigation的子組件)或非首頁顯示&am…

初階數據結構(C語言實現)——4.1棧

目錄 1.棧1.1棧的概念及結構1.2 棧的實現1.1.0 棧的初始化1.1.1 銷毀1.1.2 入棧1.1.3 出棧1.1.4 獲取棧中有效元素個數1.1.5 檢測棧是否為空,如果為空返回非零結果,如果不為空返回01.1.6 獲取棧頂元素1.1.7 驗證 附錄 棧的C語言實現源碼.h文件.c文件test…

計算光學成像與光學計算概論

計算光學成像所涉及研究的內容非常廣泛,雖然計算光學成像的研究內容是發散的,但目的都是一致的:如何讓相機記錄到客觀實物更豐富的信息,延伸并擴展人眼的視覺感知。總的來說,計算光學成像現階段已經取得了很多令人振奮…

什么樣的物聯網框架適合開展共享自助KTV唱歌項目?

現在物聯網的廣泛應用,也讓更多用戶們看到了它的實力,也使得共享經濟遍地開花。其中共享自助唱歌設備也備受歡迎,那么適合開展共享自助KTV唱歌項目的物聯網框架都應具備哪些特點呢? 智能化與自動化管理 物聯網技術在共享KTV中的應…