EDoF-ToF: extended depth of field time-of-flight imaging解讀, OE 2021

1. 核心問題:iToF相機的“景深”死穴

我們之前已經詳細討論過,iToF相機的“景深”(有效測量范圍)受到光學散焦的嚴重制約。

  • 問題根源:?當iToF相機的鏡頭散焦時,來自場景不同深度的光信號會在傳感器像素上發生混合(信號污染/Optical Crosstalk)
  • 后果:?傳感器像素測量的不再是單一深度的純凈相位信息,而是一個被污染的、錯誤的平均相位。這會導致在深度邊緣產生**“飛點”(Flying Pixels)嚴重的深度測量誤差**。
  • 傳統困境:
    • 大光圈(如f/1.4):?進光量大,信噪比高,適合遠距離或暗光環境。但光學景深極淺,散焦問題非常嚴重。
    • 小光圈(如f/8.0):?光學景深大,散焦問題緩解。但進光量急劇減少,導致信噪比極低,在遠距離或暗光下幾乎無法工作。

這個“景深-信噪比”的矛盾,是所有iToF相機在設計時都必須面對的、無法兩全其美的根本性權衡。

2. 本文解決方案:EDoF-ToF 硬件-軟件協同系統

這篇文章提出的EDoF-ToF系統,旨在徹底打破上述的權衡關系,實現一個**既有大光圈(高信噪比),又能抵抗散焦(大有效景深)**的iToF相機。

其核心思想與EDoF投影儀一脈相承,但應用在成像端:

硬件端:學習一個“深度不變”的成像PSF

  1. 定制的衍射光學元件 (DOE):?他們在iToF相機的鏡頭前,放置了一塊經過特殊設計的DOE。這個DOE的作用,是對進入相機的光場進行相位調制。
  2. AI設計DOE:?同樣地,他們建立了一個端到端的可微分模型,該模型模擬了光線從場景發出 -> 通過DOE和鏡頭 -> 在傳感器上形成點擴散函數(PSF)的全過程。
  3. 優化目標:?優化的目標是讓這個PSF具備兩個關鍵特性:
    • 深度不變性 (Depth-invariance):?PSF的形狀不隨物體的遠近而發生劇烈變化。
    • 緊湊性 (Compactness):?PSF的能量要盡可能集中,不能過度彌散,以免過度降低對比度。
  4. 最終產物:?AI最終設計出的DOE,能將傳統鏡頭隨深度變化的“高斯狀”模糊PSF,轉換成一個在很大深度范圍內都保持形態一致的、經過編碼的“工程化PSF”(Engineered PSF)。

軟件端:利用PSF先驗知識進行解碼

由于光學硬件產生的PSF是已知且深度不變的,軟件算法就可以利用這個強大的先驗信息來“解開”信號污染。

  1. 建立前向模型:?他們建立了一個精確的物理模型,描述了場景的真實深度和反射率,在經過這個已知的、深度不變的PSF模糊后,會如何在iToF傳感器上產生測量的原始相關數據(相位、幅度和偏移量)
  2. 反問題求解 (Inverse Problem):?深度重建過程就變成了一個求解反問題的過程。算法的任務是:“尋找一個什么樣的真實場景(深度圖和反射率圖),在經過我們設計的EDoF光學系統成像后,會產生我們實際測量到的這些被‘編碼污染’的數據?”
  3. 高效重建網絡:?他們設計了一個輕量級的神經網絡,該網絡學習如何高效地執行這個反演過程,從傳感器讀出的原始數據中,同時恢復出無失真的深度圖清晰的反射率(幅度)圖

3. 核心創新與實驗效果

  • 打破權衡: 實驗結果驚人。他們的EDoF-ToF系統原型,使用了一個f/1.4的大光圈鏡頭,但在深度測量的準確性上,卻媲美甚至超越了使用f/8.0小光圈的傳統ToF相機。這意味著,它在享受大光圈帶來的高信噪比(進光量是f/8的32倍!)的同時,幾乎完全免疫了光學散焦帶來的深度誤差

  • 全場景魯棒性:

    • 復雜邊緣:?在人和背景、物體和桌面的復雜邊緣處,傳統ToF相機產生了大量的飛點和扭曲,而EDoF-ToF系統恢復的邊緣則干凈利落,深度準確。
    • 細小結構:?對于場景中的細小物體(如欄桿),傳統大光圈ToF相機由于散焦,幾乎無法分辨其深度,而EDoF-ToF則能清晰地重建其三維結構。
    • 全深度范圍:?從幾十厘米的近處到數米的遠處,系統都能保持很高的深度精度。

4. 分析與意義

這篇文章是計算成像領域**“軟硬件協同設計”**思想的又一個巔峰之作,其意義深遠:

  1. 解決了iToF的核心痛點: 它從根本上解決了困擾iToF相機多年的“景深-信噪比”矛盾,為設計新一代高性能iToF傳感器指明了方向。

  2. 極大的應用價值:

    • 自動駕駛LiDAR:?未來的車載LiDAR可以采用更大光圈的光學設計,從而看得更遠、更清楚,同時不必擔心近處物體的深度失真問題。這對于探測遠處的微小障礙物和處理近處的復雜場景(如行人、自行車)至關重要。
    • AR/VR頭顯:?用于手勢追蹤和環境感知的iToF相機可以做得更小、更省電(因為進光效率高),同時精度更高,帶來更流暢、更真實的交互體驗。
    • 機器人和無人機:?在復雜的室內或室外環境中,機器人可以更可靠地進行導航和避障,因為它獲得的深度信息更加干凈和準確。
    • 消費電子:?手機上的ToF相機可以實現更精準的人像虛化、更逼真的3D掃描。
  3. 范式引領: 它再次證明,通過AI設計傳統光學無法實現的“不可能”光學元件(Computational Optics),再結合匹配的解碼算法,是突破現有成像系統物理極限的最有效途徑。這種“端到端聯合優化”的范式,將持續引領未來光學和成像系統的發展。

結論: 《EDoF-ToF》這篇文章通過將創新的大景深計算光學ToF深度感知相結合,打造出了一款性能遠超傳統設計的iToF相機原型。它不僅在學術上展示了計算成像的強大威力,更在工程上為解決自動駕駛、AR/VR等關鍵領域的實際問題提供了一個極具潛力的解決方案,是2024年ToF成像領域最值得關注的突破之一。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/90799.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/90799.shtml
英文地址,請注明出處:http://en.pswp.cn/web/90799.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

符號引用與直接引用:概念對比與實例解析

符號引用與直接引用:概念對比與實例解析 符號引用和直接引用是Java虛擬機(JVM)中類加載與執行機制的核心概念,理解它們的區別與聯系對于深入掌握Java運行原理至關重要。下面我將從定義、特性、轉換過程到實際應用,通過具體示例全面比較這兩類…

每日一講——Podman

一、概念1、定義與定位Podman(Pod Manager)是符合OCI標準的容器引擎,用于管理容器、鏡像及Pod(多容器組)。它無需守護進程(Daemonless),直接通過Linux內核功能(如命名空間…

Spring Boot DFS、HDFS、AI、PyOD、ECOD、Junit、嵌入式實戰指南

Spring Boot分布式文件系統 以下是一些關于Spring Boot分布式文件系統(DFS)的實現示例和關鍵方法,涵蓋了不同場景和技術的應用。這些示例可以幫助理解如何在Spring Boot中集成DFS(如HDFS、MinIO、FastDFS等)或模擬分布式存儲。 使用Spring Boot集成HDFS 基礎配置 // 配…

解決GoLand運行go程序報錯:Error: Cannot find package xxx 問題

問題描述 一個簡單的go程序,代碼如下 package mainimport "fmt" func main() {// 占位符,和java的String.format用法一樣fmt.Printf("我%d歲,我叫%s", 18, "yexindong") }結構如下當我想要運行時卻報錯 Error:…

Spring MVC設計精粹:源碼級架構解析與實踐指南

文章目錄一、設計哲學:分層與解耦1. 前端控制器模式2. 分層架構設計二、核心組件源碼解析1. DispatcherServlet - 九大組件初始化2. DispatcherServlet - 前端控制器(請求處理中樞)請求源碼入口:FrameworkServlet#doGet()請求委托…

k8s之控制器詳解

1.deployment:適用于無狀態服務1.功能(1)創建高可用pod(2)滾動升級/回滾(3)平滑擴容和縮容2.操作命令(1)回滾# 回滾到上一個版本 kubectl rollout undo deployment/my-app# 回滾到特定版本&…

.NET Core中的配置系統

傳統配置方式文件Web.config 進行配置。ConfigurationManager類配置。.NET配置系統中支持配置方式文件配置(json、xml、ini等)注冊表環境變量命令行自定義配置源Json文件配置方式實現步驟:創建一個json文件,把文件設置 為“如果較…

kafka的消費者負載均衡機制

Kafka 的消費者負載均衡機制是保證消息高效消費的核心設計,通過將分區合理分配給消費者組內的消費者,實現并行處理和負載均衡。以下從核心概念、分配策略、重平衡機制等方面詳細講解。一、核心概念理解消費者負載均衡前,需明確三個關鍵概念&a…

騰訊云edges on部署pages

騰訊云edges on部署pages適用場景部署方式官方文檔 適用場景 Next.js Hexo 以及用React Vue等現代前端框架構建的單頁應用全棧項目開發 通過Pages Function KV等能力 實現輕量化的動態服務快速部署與迭代 通過Github等代碼管理平臺集成 每次代碼提交時自動構建和部署網站 注…

SpringAI入門及淺實踐,實戰 Spring? AI 調用大模型、提示詞工程、對話記憶、Adv?isor 的使用

上一次寫AI學習筆記已經好久之前了,溫習溫習,這一章講講關于Spring? AI 調用大模型、對話記憶、Adv?isor、結構化輸出、自定義對話記憶?、Prompt 模板的相關知識點。 快速跳轉到你感興趣的地方一、提示詞工程(Prompt)1. 基本概…

對抗攻擊-知識點

文章目錄自然圖像往往靠近機器學習分類器學習到的決策邊界(decision boundaries)。正交方向--改變某一個不影響其它的特征降采樣(Feature Downsampling)通過黑盒攻擊的持續挑戰,我們才能構建真正安全可靠的智能系統DCT…

7.26 作業

一、實驗要求及其拓撲圖: 本次實驗拓撲圖: 二、實驗IP地址劃分: 1. 公網地址(R5 作為 ISP,使用公網地址): R1 與 R5 之間接口:15.1.1.0/24,R1 側為 15.1.1…

Kafka運維實戰 14 - kafka消費者組消費進度(Lag)深入理解【實戰】

目錄什么是消費者 Lag舉例說明:Lag 的意義:Lag 監控和查詢kafka-consumer-groups基本語法常用命令示例1. 查看單個消費者組的詳細信息(最常用)2. 列出所有消費者組(只顯示名稱)3. 列出所有消費者組&#xf…

設計模式(十三)結構型:代理模式詳解

設計模式(十三)結構型:代理模式詳解代理模式(Proxy Pattern)是 GoF 23 種設計模式中的結構型模式之一,其核心價值在于為其他對象提供一種間接訪問的機制,以控制對原始對象的訪問。它通過引入一個…

24點數學游戲(窮舉法求解表達式)

摘要本畢業設計旨在利用MATLAB技術實現一個24點數學游戲,采用窮舉法求解所有可能的表達式組合。通過全排列數字、枚舉運算符及括號位置,結合遞歸回溯算法,系統能夠高效地搜索所有可能的運算路徑,并驗證結果是否為24。實驗結果表明…

【web應用】如何進行前后端調試Debug? + 前端JavaScript調試Debug?

文章目錄一、前后端:后端以Debug模式運行后端項目,打斷點二、前后端:前端項目在瀏覽器中調試三、單獨前端:前端JavaScript調試1、控制臺輸出2、網頁調試器中添加斷點3、debugger關鍵字一、前后端:后端以Debug模式運行后…

FreeCAD開發樓梯參數化三維模型和鋼格柵

根據樓梯標準圖集開發各種樓梯。上行左轉,上行右轉,對應的欄桿也是配套2種。樓梯總成鋼格柵標準里的跨度和承載 扁鋼尺寸,輕松切換和修改參數。格柵綜合本來格柵上橫桿是冷軋扭鋼筋,先繪制一個圓柱,再做一個內切正方形…

【AcWing 836題解】合并集合

AcWing 836. 合并集合 【題目描述】 在查看解析之前,先給自己一點時間思考哦! 【題解】 并查集是一種用于處理集合合并與查詢問題的數據結構,通常支持以下兩種操作: Find:查詢一個元素所在的集合。 Union&#xff1a…

MySQL鎖機制與MVCC原理剖析

在MySQL中,我們使用到了它的各種類鎖;按照它的維度,有各種鎖 從數據庫的操作粒度有,表鎖,行鎖。從數據庫的操作的類型,有讀鎖和寫鎖。性能上有樂觀鎖和悲觀鎖。 在上一篇文章中的事務隔離級別,需…

C++學習(線程相關)

目錄 一、線程庫thread 1.使用外部函數 2. 使用類的函數 3. 添加參數 二、線程庫 mutex 1.使用lock()方法 2.try_lock()方法 三、線程庫lock_guard 四、線程庫unique_lock 1.adopt_lock 2.defer_lock() 五、線程庫call_once 六、線程庫promise & future 七、c…