怎么用LoRA的低秩結構近似Fisher矩陣
目錄
- 怎么用LoRA的低秩結構近似Fisher矩陣
- **1. Fisher矩陣的內存挑戰**
- **2. LoRA的低秩結構與Fisher近似**
- **3. 具體實現步驟**
- **4. 示例說明**
- **5. 有效性分析**
- **6. 擴展與優化**
- **總結**
在LoRA(低秩適應)中,通過低秩結構近似Fisher矩陣的核心思想
是利用參數矩陣的低秩特性,將高維Fisher矩陣分解為低秩矩陣的乘積,從而顯著降低內存占用。以下是具體方法和示例說明:
1. Fisher矩陣的內存挑戰
- Fisher矩陣:在自然梯度下降中,Fisher信息矩陣 F F F 描述了參數空間的曲率,用于調整梯度方向以優化收斂性。其計算復雜度為