??????2022 年 11 月 30 日一個很重要的標志事件就是chatgpt的出現,打開了生成式人工智能的開端。這也許會是一個歷史性的時刻,今天是2025年4月,過去兩年多,那個時刻目前回想還是對本人造成了沖擊,一個完全有自主分析能力的生成式AI機器人。這也標志新一輪的技術突破開始了。
? ? ? ? 早期所有人都采用強化學習進行深度學習應用,但是在2021年開始,生成式的訓練方式開始出現,行業內有一段時間出現,模擬生成缺陷的技術方案。但是這種方案最終沒有發展起來,主要問題是主干網絡的模型參數小,無法模擬更自然的缺陷數據。在這個過程中,技術人員對主干網絡特征(早期是Resnet,目前是VIT)映射到相似的生成數據上,用來模擬缺陷數據方案。
? ? ? ? 模擬數據的輸出,也是最早期生成式網絡的開端。在2023年開始,這種以模型總結數據特征,并提煉數據信息特征,在通過編碼映射為人類可以理解的信息成為主流。包括目前流行的DeepSeek,文心一言,豆包等模型。不同的是處理數據方式和采用的數據有差異,基本原理都是一致的。在研發過程中有一個特別重要的信息數據信息特征。
? ? ? ? 數據信息特征是高質量的人工標注數據通過強化學習得到的,目前公開的高質量數據特別多,也被大部分團隊重復使用。所以從數據層面模型的能力都差不多,只是不同模型偏重的方向不一樣。有對話,視覺,音頻等,各種針對不同場景的模型。
? ? ? ? 同樣在工業檢測的應用中,我們也是采用的數據信息特征進行分析。完成生成式的AI用來檢測工業缺陷。在使用過程中,目前主流的預訓練視覺模型比如dinov2,CLIP等多模態模型,因為通過大數據的強化學習后,模型的特征提取主要基于范式的特征信息,而非指定的數據特征,這對生成過程中的數據容差特別重要。
? ? ? ? 通過預訓練的大模型,生成基于當前輸入的圖片特征BackOne。獲得最基本的范式特征信息,這些特征可以進行MLP擬合或者特征比對,輸出缺陷區域,和缺陷類型。完成生成過程的檢測
? ? ? ? 博主對這套大模型方案已經完成,可以在DY關注“軍哥講視覺”,或者WX搜索“軍哥講視覺”進行詳細了解