1實驗背景
數字圖像相關法DIC是材料力學領域研究的關鍵技術,其中局部DIC憑借亞像素級精度、全場測量等優勢,成為材料局部變形分析的優選方案。傳統CPU計算難以應對局部DIC數萬個子區并行計算需求,新興GPU算法一定程度提高了計算效率,如OpenCorr-GPU開源方案。
千眼狼研發工程師們,自主研發局部DIC-GPU算法,針對自研的DIC軟硬件生態深度優化。研發人員通過開展幾組經典實驗,并與開源GPU算法進行橫向對比。
2技術原理
自研局部DIC-GPU算法核心是將圖像數據、子區網格位置和寬高信息預加載至GPU顯存,利用數千核心并行處理所有子區的互相關計算。工程師們優化了線程調度,減少內存訪問冗余,并自研子區網格動態分配策略,以最大化調用GPU算力資源。
3實驗驗證
為驗證實際效果,千眼狼工程師設計了六組實驗,實驗基于同一測試環境GPU 4070開展:
場景1 仿真旋轉
數據規模:有效子區個數0.4W
計算結果:左 開源算法耗時160ms,右 自研算法耗時僅54ms
場景2 仿真輻射
數據規模:有效子區個數1.7W
計算結果:左 開源算法耗時696ms,右 自研算法耗時僅85ms
場景3 圓桿拉伸
數據規模:有效子區個數0.3W
計算結果:左 開源算法耗時826ms,右 自研算法耗時僅64ms
場景4 三點彎
數據規模:有效子區個數0.7W
計算結果:左 開源算法耗時2011ms,右 自研算法耗時僅109ms
場景5 孔洞拉伸
數據規模:有效子區個數3.2W
計算結果:左 開源算法耗時2755ms,右 自研算法耗時僅148ms
場景6 拉伸裂紋
數據規模:有效子區個數6.6W
計算結果:左 開源算法耗時3855ms,右 自研算法耗時僅217ms
六大實驗場景耗時對比
千眼狼自研GPU加速算法較開源GPU 提速3–18倍,且子區規模越大優勢越顯著。如圓桿拉伸0.3W子區提速3倍,6.6W子區拉伸裂紋場景提速18倍。
六大實驗場景精度對比
千眼狼工程師們使用帶有位移真值的仿真素材做精度對比,素材位移真值為振幅衰減的正弦函數,繪制自研GPU計算結果、開源GPU計算結果和位移真值曲線如下:
將兩組計算結果與真值的平均絕對誤差和均方根誤差如下:
4實驗結論
通過上述實驗對比,千眼狼自主研發的局部DIC-GPU算法與開源GPU算法在精度一致的前提下,在效率、適用性、穩定性上有較大提升。
1)效率:實現了較開源算法同計算場景下的3~18倍的提升。?
2)適用性:涵蓋從仿真到實拍不同場景,可高效處理萬級以上子區。
3)穩定性:計算結果與開源方案誤差≤0.03pixel,滿足科研級精度需求。
5實驗展望
千眼狼自主研發的局部DIC-GPU加速算法已融入DIC軟硬件生態系統,幫助科研人員提高在焊接殘余應力、裂紋尖端變形等局部應變分析場景中的科研效率, 以更先進的性能賦能科學研究與工業智造。