本筆記主要為了記錄自己的科研日報,前段時間剛開始想寫的初衷也是為了自己的思考不跑偏,但是有幾天又沒有堅持下來,看到一位學長的文章,發現這種形式還是很有必要的,所以自己也打算堅持記錄下來,由于還正在學習探索階段,所以可能很多想法都不成熟,未來我也將會多多思考,一起監督,持續更新本文,歡迎一起交流學習呀~
2025.04.13
兩種方案,一種是手動清洗,一種是利用中間域(提取不同域風格的共性)
思考:① 如何把不同的背景信息統一
2025.04.14
數據集背景已統一,后期將根據實驗結果,從代碼的模塊進行改進,多看論文。
找找視覺語言模型,CLIP 相關的統一的論文對比 ,文本描述暫時可以不考慮,因為比較難,涉及到專業描述的知識,建議從其他圖像特征方面進行考慮。
2025.04.16
仔細閱讀VLP-UDA代碼,直到可以老師指哪行,就知道意思和作用
替換背景的圖片作為中間域
2025.04.23
初步確定自己的創新點
1.復雜場景到單一場景 真實域->中間域->實驗室域
2.前景注意力機制
3.數據集
2025.04.24
真實域(網絡上的圖片)和中間域(將真實域網絡上的圖片背景統一的域)以及實驗域
通過引入中間域的,可以避免直接從源域到目標域學習的挑戰:
1.源域和目標域存在較大的域差異
2.模型需要一次性解決所有領域差異問題
3.缺乏中間過渡可能導致知識遷移不充分
引入中間域的優勢:
1.漸進式適應:通過中間域作為橋梁,可以分階段逐步適應不同領域間的差異,降低學習難度
2.減少領域差異:中間域可以緩解源域與目標域之間的分布差異,使知識遷移更加平滑
3.聚焦特定挑戰:每個階段可以針對特定的領域差異進行優化,而不是同時面對所有差異
4.提高可解釋性:分階段學習使知識轉移過程更加透明,便于理解模型如何從源域概念過渡到目標域
2025.04.25
如何將源域 中間域 以及 目標域 分階段學習起來?
閱讀TTSDA-YOLO的論文,思考將他提出的兩階段訓練方法作為我第一個創新點的實現方法
鑒于他沒有開源代碼,已發郵件但未果,但是方法巧妙,根據老師的建議,決定學習他的思想,自己實現相關的功能。
2025.04.26
分階段訓練,比如
第一階段的 200個epoch訓練真實域和中間域,用A模塊
第二個階段的100個epoch訓練中間域,用B模塊
測試階段使用目標域
2025.05.01
嘗試將論文里面的IDA和BRM模塊用進我的任務里面,看看效果
再根據具體的效果修改方法
五一期間堅持更新中~沉淀思考ing