前言摘要
近日,國際頂尖光學期刊《Light: Science & Applications》刊登了一項來自中國國防科技大學研究團隊的重要成果。該團隊由姜天教授、張軍教授和郝浩教授領銜,成員包括嚴秋全、歐陽灝(共同一作)等研究人員。他們提出了一種創新的深度強化學習校準(Deep Reinforcement learning-based Calibration, DRC)方法,成功解決了多波長光學信息處理系統中的關鍵瓶頸問題——由制造、傳輸和環境因素引起的頻率選擇性響應失真。
核心內容
1. 研究背景 ?
? ?多波長光信息處理系統(如光學神經網絡、寬帶信號處理器)因低能耗、高帶寬等優勢被廣泛應用,但實際中常受頻率選擇性響應(如器件制造缺陷、環境干擾)影響,導致計算誤差。 ?
? ?傳統校準方法(如模型驅動或優化算法)依賴復雜建模或迭代效率低,難以適應動態環境。??
2. 創新方法 ?
? ?深度強化學習校準(DRC):受深度確定性策略梯度(DDPG)啟發,DRC通過實時與環境交互學習最優校準策略,無需精確建模即可適應不同系統(如色散補償光纖、微環諧振器陣列、馬赫-曾德爾干涉儀陣列)。 ?
? ?實驗驗證:在三類系統中,DRC僅需21次迭代即實現收斂,顯著優于遺傳算法(GA)、隨機并行梯度下降(SPGD)和比例-積分-微分(PID)等傳統方法。??
3. 性能優勢 ?
? ?精度提升:DCF系統輸出誤差降低78%,MRR陣列方差降至3.89×10??,MZI陣列相對誤差減少85.4%。 ?
? ?泛化能力:可適應振動、溫濕度變化等環境擾動,適用于光學卷積計算加速、光網絡路由等場景。
圖1:基于色散補償光纖(DCF)系統的校準架構與結果。
(a) 展示了校準鏈路。
(b) 呈現了克爾光頻梳的封裝芯片照片。
(c) 顯示了系統中使用的由克爾光頻梳生成的50條光學梳齒。
(d) 展示了使用具有不同梳齒數量的激光光源時,四種校準算法所需的迭代次數。
(e)和(f)分別展示了使用20條梳齒和50條梳齒作為激光光源時,基于DCF的系統在應用DRC校準前和校準后的輸出結果對比。
圖2:基于微環諧振器(MRR)陣列系統的校準架構與結果。
(a) 展示了3×3MRR系統的校準鏈路。
(b) 展示了應用于不同MRR陣列系統的各種校準算法所需的迭代次數。左上角小插圖展示了3×3MRR陣列芯片及其封裝芯片的照片。
(c)和(d)分別展示了在校準過程中,采用DRC和PID校準算法時,不同微環諧振器的輸出結果。
圖3:基于馬赫-曾德爾干涉儀(MZI)陣列系統的校準架構與結果。
(a) 展示了MZI陣列芯片的照片。
(b)–(d) 分別展示了在校準過程中,采用DRC、GA和SPGD校準算法時,MZI陣列芯片的輸出結果。
(e) 描繪了MZI陣列系統的校準鏈路。
圖4:基于不同多波長系統構建的神經網絡模型在不同校準誤差下的分類精度對比。
(a) 展示了基于不同光學卷積單元的神經網絡架構。
(b)–(d) 分別展示了使用基于DCF系統、基于MRR系統和基于MZI系統構建的神經網絡,在應用不同算法校準后的分類精度。
圖5:多波長系統中校準過程的流程圖。
黃色模塊代表系統的組成部分,數字表示校準步驟的先后順序。
結語
國防科技大學團隊的這項研究,巧妙地運用人工智能前沿技術——深度強化學習,攻克了多波長光學信息處理中的核心校準難題。其提出的DRC方法以“21次迭代”的高效率和“誤差直降85%”的高精度,為未來高速、低功耗的光計算芯片和光信號處理系統的實用化鋪平了道路。這不僅是光子學與人工智能融合的典范,也預示著智能光學系統自主優化新時代的到來。
Doi:https://doi.org/10.1038/s41377-025-01846-6
【注】:小編水平有限,若有誤,請聯系修改;若侵權,請聯系刪除!