一、現實痛點:當人臉被遮擋,AI “認臉” 有多難?
你是否遇到過這樣的場景?
- 中考體育測試:2025 年天津泰達街中考考場要求考生 “臉部無遮擋” 才能通過人臉識別入場,戴口罩、帽子的學生需現場調整發型。
- 智能門鎖:奇景光電在 CES 2025 推出的 WiseEye 掌靜脈模塊,通過掌靜脈 + 人臉識別雙模態技術,解決了嚴寒環境下戴手套無法識別的問題。
- 安防監控:2024 年某裝修企業因 “未告知用戶” 采集人臉信息被處罰,凸顯隱私保護與技術應用的矛盾。
真實場景中的人臉遮擋,正在成為 AI “認臉” 的核心挑戰。據《中國安防行業數字安全建設與發展白皮書》顯示,2024 年智能安防市場規模突破 1.06 萬億元,但傳統人臉識別技術在 30% 面部遮擋時準確率驟降 40%,在合規與效率間陷入兩難。
傳統方法為何在真實數據上 “翻車”?
過去,研究者常用深度學習模型處理人臉去遮擋問題,但效果始終不理想。核心原因在于:訓練數據和真實數據 “長得不一樣”。
- 合成數據太 “假”:傳統方法依賴合成數據(如在干凈人臉圖像上人工粘貼遮擋物),但合成的遮擋物往往光照不自然、邊緣生硬,與真實遮擋(如口罩貼合面部的陰影、墨鏡的反光)存在明顯差異。
- 結構信息缺失:合成數據中的人臉多為正面、表情自然的 “標準臉”,而真實場景中遮擋人臉可能有側臉、夸張表情、復雜光照,模型難以泛化。
這種 “合成數據→真實數據” 的 “域差距”,讓模型在真實遮擋場景下頻頻 “翻車”。如何讓 AI 看懂 “真實世界的遮擋”?這篇論文給出了突破性方案。
二、核心創新:三階段 “步步引導”,讓 AI 學會 “拆解難題”
三階段級聯引導學習框架
將人臉去遮擋拆解為三個連續階段,像 “流水線” 一樣逐步修復遮擋區域:
- 第一階段:遮擋檢測(找遮擋)
先定位遮擋的具體位置和形狀,輸出一張 “遮擋掩碼”(白色區域為遮擋,黑色為未