神經網絡與深度學習 網絡優化與正則化

1.網絡優化存在的難點

(1)結構差異大:沒有通用的優化算法;超參數多

(2)非凸優化問題:參數初始化,逃離局部最優

(3)梯度消失(爆炸)

2.網絡優化方法-梯度下降法

(1)批量梯度下降法(bgd)

使用所有樣本進行更新參數

(2)隨機梯度下降法(sgd)

使用一個樣本更新參數

(3)小批量梯度下降法(mbgd)

利用部分樣本更新參數

3.網絡優化算法 -學習率

太低導致迭代慢,太高導致迭代遠離局部最優

學習率的改進策略

按迭代次數進行衰減

自適應,根據梯度進行自我調整

4.網絡優化方法-梯度方向優化

動量法

梯度截斷

5.學習率+梯度優化Adam

6.參數初始化、數據預處理,逐層歸一化

參數初始化的作用:

  • 避免梯度消失 / 爆炸:合理初始化參數(如 Xavier、He 初始化)可維持網絡中梯度的穩定流動,防止因參數值過大或過小導致梯度在反向傳播中消失或爆炸,確保模型能有效學習。
  • 加速收斂速度:合適的初始值能讓模型從更優的起點開始迭代,減少訓練過程中陷入局部最優的概率,使模型更快收斂到較優解。
  • 保證網絡對稱性破缺:若參數初始化為相同值,網絡各層神經元會學習到相同特征,失去對稱性破缺。隨機初始化可使神經元以不同起點學習,提升網絡表達能力。
  • 影響模型泛化能力:不當初始化可能導致模型陷入不良局部最優,而合理初始化能讓模型學習到更具泛化性的特征表示,提升在未知數據上的表現。

數據預處理的作用:

  • 提升模型性能:清洗噪聲、處理缺失值等操作可讓數據更 “干凈”,使模型能更好地學習數據中的模式和特征,避免因數據質量問題導致模型訓練效果不佳。
  • 保證數據一致性:對數據進行標準化、歸一化等處理,統一數據的尺度和分布,防止不同特征因量綱差異影響模型訓練,確保模型對各特征的學習公平合理。
  • 增強數據適用性:通過數據增強(如旋轉、裁剪等)擴充數據集規模和多樣性,減少模型過擬合風險,提升模型在不同場景下的泛化能力。
  • 適配模型輸入要求:將原始數據(如圖像、文本等)轉換為模型可接受的格式和維度,例如將圖像 Resize 到固定尺寸、把文本轉換為向量表示,使數據能順利輸入模型進行訓練和推理。

逐層歸一化的作用:

  • 緩解內部協變量偏移:通過對每層輸入數據歸一化,穩定數據分布,減少因參數更新導致的分布變化,使模型訓練更穩定。
  • 加速訓練收斂:歸一化后的數據分布更易被模型學習,可使用更大學習率,減少梯度震蕩,顯著提升訓練速度。
  • 抑制梯度消失 / 爆炸:歸一化維持了梯度傳播的穩定性,避免深層網絡中梯度因數據分布波動而異常,增強網絡訓練可行性。
  • 增強模型泛化能力:歸一化過程具有一定正則化效果(如 Batch Norm 的隨機性),可減少過擬合,提升模型對不同輸入的適應性。
  • 降低參數初始化敏感性:歸一化后的數據對參數初始值的要求更寬松,無需精細調參即可實現有效訓練。

7.網絡正則化的機理

?

1.?抑制過擬合

通過約束模型復雜度,避免模型過度擬合訓練數據中的噪聲或局部特征,增強對未知數據的泛化能力。

2.?參數約束與簡化

  • L1/L2 正則化:通過在損失函數中添加參數范數懲罰項(如 L1 的絕對值和、L2 的平方和),迫使模型參數趨近于 0(L1 更易產生稀疏解),減少無效特征的影響。
  • 權重衰減:類似 L2 正則化,通過限制權重大小,降低模型對輸入微小變化的敏感性。

3.?引入隨機性與噪聲

  • Dropout:訓練時隨機丟棄部分神經元,迫使模型學習更魯棒的特征組合,避免依賴特定神經元,類似 “集成學習” 效果。
  • 數據增強:通過擴充訓練數據(如旋轉、翻轉圖像),增加輸入多樣性,使模型學習更普適的特征。

4.?約束網絡表示

  • Batch Normalization:歸一化層輸入分布,緩解內部協變量偏移,同時因噪聲注入(如批量統計量的隨機性)產生正則化效果。
  • 早停(Early Stopping):在驗證集性能未惡化時提前終止訓練,避免模型過度擬合訓練數據的后期迭代。

5.?集成與平滑化

  • 標簽平滑(Label Smoothing):將硬標簽(如 one-hot)軟化(如均勻分布),防止模型對某一類別過度自信,增強泛化性。
  • 集成學習(如模型平均):結合多個模型的預測結果,降低單一模型的方差,提升穩定性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/83696.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/83696.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/83696.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【匯編逆向系列】二、函數調用包含單個參數之整型-ECX寄存器,LEA指令

目錄 一. 匯編源碼 二. 匯編分析 1. ECX寄存器 2. 棧位置計算? 3. 特殊指令深度解析 三、 匯編轉化 一. 匯編源碼 single_int_param:0000000000000040: 89 4C 24 08 mov dword ptr [rsp8],ecx0000000000000044: 57 push rdi0000…

Linux進程替換以及exec六大函數運用

文章目錄 1.進程替換2.替換過程3.替換函數exec3.1命名解釋 4.細說6個exe函數execl函數execvexeclp、execvpexecle、execve 1.進程替換 fork()函數在創建子進程后,子進程如果想要執行一個新的程序,就可以使用進程的程序替換來完成…

Selenium操作指南(全)

🍅 點擊文末小卡片,免費獲取軟件測試全套資料,資料在手,漲薪更快 大家好,今天帶大家一起系統的學習下模擬瀏覽器運行庫Selenium,它是一個用于Web自動化測試及爬蟲應用的重要工具。 Selenium測試直接運行在…

結構性設計模式之Facade(外觀)設計模式

結構性設計模式之Facade(外觀)設計模式 前言: 外觀模式:用自己的話理解就是用戶看到是一個總體頁面,比如xx報名系統頁面。里面有歷年真題模塊、報名模塊、教程模塊、首頁模塊… 做了一個各個模塊的合并,對…

RabbitMQ實用技巧

RabbitMQ是一個流行的開源消息中間件,廣泛用于實現消息傳遞、任務分發和負載均衡。通過合理使用RabbitMQ的功能,可以顯著提升系統的性能、可靠性和可維護性。本文將介紹一些RabbitMQ的實用技巧,包括基礎配置、高級功能及常見問題的解決方案。…

Linux(10)——第二個小程序(自制shell)

目錄 ?編輯 一、引言與動機 📝背景 📝主要內容概括 二、全局數據 三、環境變量的初始化 ? 代碼實現 四、構造動態提示符 ? 打印提示符函數 ? 提示符生成函數 ?獲取用戶名函數 ?獲取主機名函數 ?獲取當前目錄名函數 五、命令的讀取與…

環境變量深度解析:從配置到內核的全鏈路指南

文章目錄 一、基礎概念與核心作用二、常見環境變量三、操作指南:從查看、修改到調試3.1 快速查詢3.2 PATH 原理與配置實踐3.2.1 命令執行機制3.2.2 路徑管理策略 四、編程接口與內存模型4.1 環境變量的內存結構4.2 C 語言訪問方式4.2.1 直接訪問(main 參…

結合Jenkins、Docker和Kubernetes等主流工具,部署Spring Boot自動化實戰指南

基于最佳實踐的Spring Boot自動化部署實戰指南,結合Jenkins、Docker和Kubernetes等主流工具,提供從環境搭建到生產部署的完整流程: 一、環境準備與工具選型?? ??1.基礎設施?? ??Jenkins服務器??:安裝Jenkins LTS版本,配置JDK(推薦JDK 11+)及Maven/Gradle插…

動態規劃---股票問題

1.在推狀態轉移方程的途中,箭頭的起始點表示前一天的狀態,箭頭的終點是當天的狀態 2.當動態規劃中涉及到多狀態,且狀態之間可以相互轉換,要畫圖去分析 1.買賣股票的最佳時機含冷凍期 題目鏈接:309. 買賣股票的最佳時機…

ObjectMapper 在 Spring 統一響應處理中的作用詳解

ObjectMapper 是 Jackson 庫的核心類,專門用于處理 JSON 數據的序列化(Java 對象 → JSON)和反序列化(JSON → Java 對象)。在你提供的代碼中,它解決了字符串響應特殊處理的關鍵問題。 一、為什么需要 Obj…

總結這幾個月來我和AI一起開發并上線第一個應用的使用經驗

副標題: 當“手殘”前端遇到AI隊友,我的音樂小站譜貝誕生記 大家好,我最近干了件“不務正業”的事——**獨立開發并上線了一個完整的網站 作為一個前端“手殘黨”(還在努力學習中😅),這次能成功…

【大模型:知識圖譜】--5.neo4j數據庫管理(cypher語法2)

目錄 1.節點語法 1.1.CREATE--創建節點 1.2.MATCH--查詢節點 1.3.RETURN--返回節點 1.4.WHERE--過濾節點 2.關系語法 2.1.創建關系 2.2.查詢關系 3.刪除語法 3.1.DELETE 刪除 3.2.REMOVE 刪除 4.功能補充 4.1.SET (添加屬性) 4.2.NULL 值 …

結構體指針與非指針 問題及解決

問題描述 第一段位于LCD.h和LCD.c中, 定義個一個結構體lcd_params,并直接給與指針名*p_lcd_params; 我發現我在調用這個結構體時,即在LCD.c中,使用指針類型定義的 static p_lcd_params p_array_lcd[LCD_NUM]; static p_lcd_par…

【設計模式-3.7】結構型——組合模式

說明:本文介紹結構型設計模式之一的組合模式 定義 組合模式(Composite Pattern)又叫作整體-部分(Part-Whole)模式,它的宗旨是通過將單個對象(葉子節點)和組合對象(樹枝…

【TMS570LC4357】之相關驅動開發學習記錄2

系列文章目錄 【TMS570LC4357】之工程創建 【TMS570LC4357】之工程配置修改 【TMS570LC4357】之HALCOGEN使用 【TMS570LC4357】之相關問題及解決 【TMS570LC4357】之相關驅動開發學習記錄1 ——————————————————— 前言 記錄筆者在第一次使用TMS570過程中對…

3D Gaussian splatting 05: 代碼閱讀-訓練整體流程

目錄 3D Gaussian splatting 01: 環境搭建3D Gaussian splatting 02: 快速評估3D Gaussian splatting 03: 用戶數據訓練和結果查看3D Gaussian splatting 04: 代碼閱讀-提取相機位姿和稀疏點云3D Gaussian splatting 05: 代碼閱讀-訓練整體流程3D Gaussian splatting 06: 代碼…

【黑馬程序員uniapp】項目配置、請求函數封裝

黑馬程序員前端項目uniapp小兔鮮兒微信小程序項目視頻教程,基于Vue3TsPiniauni-app的最新組合技術棧開發的電商業務全流程_嗶哩嗶哩_bilibili 參考 有代碼,還有app、h5頁面、小程序的演示 小兔鮮兒-vue3ts-uniapp-一套代碼多端部署: 小兔鮮兒-vue3ts-un…

前端使用 preview 插件預覽docx文件

目錄 前言一 引入插件二 JS 處理 前言 前端使用 preview 插件預覽docx文件 一 引入插件 建議下載至本地,靜態引入,核心的文件已打包(前端使用 preview 插件預覽docx文件),在文章目錄處下載至本地,復制在項…

如何在運動中保護好半月板?

文章目錄 引言I 半月板的作用穩定作用緩沖作用潤滑作用II 在跳繩運動中保護好半月板III 半月板損傷自測IV 半月板“殺手”半月板損傷必須滿足四個因素:消耗品引言 膝蓋是連接大腿骨和小腿骨的地方,在兩部分骨頭的連接處,墊著兩片半月形的纖維軟骨板,這就是半月板。半月板分…

安科瑞防逆流方案落地內蒙古中高綠能光伏項目,筑牢北疆綠電安全防線

一、項目概況 內蒙古阿拉善中高綠能能源分布式光伏項目,位于內蒙古烏斯太鎮,裝機容量為7MW,采用自發自用、余電不上網模式。 用戶配電站為35kV用戶站,采用兩路電源單母線分段系統。本項目共設置12臺35/0.4kV變壓器,在…