fisher矩陣元素有什么含義和原理
目錄
- fisher矩陣元素有什么含義和原理
- 一、對角線元素( F i , i F_{i,i} Fi,i?)的含義與原理
- 二、非對角線元素( F i , j F_{i,j} Fi,j?)的含義與原理
- Fisher 信息矩陣的形式
- 矩陣的寬度有位置權重數量決定
- 1. **模型參數結構決定矩陣維度**
- 2. **對數似然函數的二階導數推導**
- 3. **Fisher 信息矩陣的最終形式**
- 元素解釋:
- 得到fisher矩陣之后怎么使用
- 模型與參數設定
- 取值示例
- 樣本計算
- fisher矩陣給出 θ 更新過程
- 步驟 1:計算預測概率 p i p_i pi?
- 步驟 2:計算梯度 ? ? ( θ ) \nabla\ell(\theta) ??(θ)
- 步驟 3:計算 Fisher 信息矩陣 F ( θ ) F(\theta) F(θ)
- 步驟 4:求 Fisher 信息矩陣的逆 F ( θ old ) ? 1 F(\theta_{\text{old}})^{-1} F(θold?)?1
- 步驟 5:更新參數 θ new \theta_{\text{new}} θnew?
以圖像識別貓狗任務為例,假設模型通過神經網絡提取圖像特征(如毛發紋理、耳朵形狀等),輸出屬于“貓”的概率 p ( y = 貓 ∣ x , θ ) p(y=\text{貓}|x, \theta)