Batch Normalization[[

Batch Normalization[[

news/2025/7/13 2:59:24/文章來源:https://blog.csdn.net/weixin_67446974/article/details/148264918

error surface如果很崎嶇,那么就代表比較難train,我們有沒有辦法去改變這個landscape呢

可以用batch normalization.

如果 ( x_1 ) 的取值范圍很小（如 1, 2），而 ( x_2 ) 的取值范圍很大（如 100, 200），那么 ( w_2 ) 的變化會對輸出 ( \hat{y} ) 產生更大的影響，進而導致損失 ( L ) 的變化也很大（+ΔL large）。
這會導致梯度更新時，某些方向變化很大，某些方向變化很小，優化過程不平衡。
如果特征的尺度差異很大，損失函數的地形會很“陡峭”或“扁平”，導致梯度下降時路徑彎曲，優化困難。
經過特征歸一化后，損失函數的地形變得“圓滑”，各個方向變化一致，優化路徑更直接，收斂更快。

我們想要這個loss landscape變得平滑,就要進行特征歸一化

feature normalization

將每一維的數值特征歸一化,使他們平均為0,方差為1

我們經過一層normalization后的x經過w得到z再經過activate function得到a,那么a和z實際上對w2是input,那么就有可能特征差異大,所以要在z或者a再做一次normalization,在哪里做其實差異不大

z是向量/矩陣,但是經過normalization后,每一個z的小改變就會引起后面三個a的改變,相比input時候是單獨改變

為什么說這個network是一個large的network?

歸一化操作本身就把原本“每個樣本獨立”的網絡，變成了“所有樣本互相關聯”的大網絡

因為我們沒辦法把所有的這個data都進行normalization,改為在一個batch做normalization

我們再歸一化之后還要讓機器learn出來γ和β干什么呢?這樣子不就會導致我們每一個dimension的分布不接近了嗎?

我們一開始會設置兩個參數向量分別為1和0,讓訓練初期的dimension分布比較接近,找到一個好的error surface后再慢慢加進去

如果我們真正在做application的時候,資料不是一個batch的傳進來,我們無法累計到一個batch再計算,我們就得用滑動平均來計算

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/907297.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/907297.shtml
英文地址，請注明出處：http://en.pswp.cn/news/907297.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

c++結構化綁定

c++結構化綁定

author: hjjdebug date: 2025年 05月 28日星期三 15:57:58 CST descrip: c結構化綁定: 結構化綁定: 名稱辨析: 名稱叫綁定好還是叫解綁好？ 解綁意思是原來是一個整體,現在被分成了若干個部分,所以叫解. 綁定強調的意思是. 被分解的某個變量,綁定到了整體的某個變量…

閱讀更多...

大數據治理：理論、實踐與未來展望(一）

大數據治理：理論、實踐與未來展望(一）

文章目錄一、大數據治理的定義與重要性（一）定義（二）重要性二、大數據治理的應用場景（一）金融行業（二）醫療行業（三）制造業（四）零售行…

閱讀更多...

AI系統化學習月計劃6月計劃

AI系統化學習月計劃6月計劃

以下是為技術總監設計的 AI系統化學習月計劃（每天投入2小時，共30天），結合戰略思維、技術基礎、實戰應用和行業趨勢，幫助您快速掌握AI的核心知識，并轉化為業務決策能力。第一周：AI基礎與戰略思維…

閱讀更多...

詳解MySQL調優

詳解MySQL調優

目錄 1. SQL 語句優 1.1 避免低效查詢 1.2 索引優化 1.3 分析執行計劃 2. 數據庫配置優化 2.1 核心參數調整 2.2 表結構與存儲引擎 2.3 存儲引擎選擇 3. 事務與鎖優化 3.1 事務控制 3.2 鎖機制優化 3.3 批量操作優化 4. 其他優化手段 4.1 監控與分析工具 4.2 讀寫…

閱讀更多...

VScode單雙引號、分號格式

VScode單雙引號、分號格式

1、settings.json中添加： 1 2 3 "prettier.semi": false, // 取消自動加分號 "prettier.singleQuote": true, // 保持單引號，不自動變雙引號 "prettier.trailingComma": "none" // 去掉結尾的逗號 2、如上一步…

閱讀更多...

自動駕駛規劃控制教程——不確定環境下的決策規劃

自動駕駛規劃控制教程——不確定環境下的決策規劃

引言：駕馭未知——不確定性下的自動駕駛決策挑戰自動駕駛汽車 (Autonomous Vehicles, AVs) 的愿景是徹底改變交通運輸的面貌，提高道路安全、提升交通效率、改善駕乘體驗。然而，要將這一愿景安全可靠地付諸實踐，自動駕駛系統必須能夠在復雜、動態且充滿不確定性的真實世界…

閱讀更多...

電纜中性點概念

電纜中性點概念

電纜中性點概念電纜中性點（也稱“中性點”或“中性線”）是電力系統和電氣設備中一個非常重要的概念，尤其在三相電系統中。下面是對中性點概念的系統性解釋。 1. 基本定義中性點：三相電纜（A/B/C相）的電壓矢量交匯點，理想情況下三相平衡時該點電壓為零。對于星形（Y形…

閱讀更多...

MyBatis 動態 SQL 詳解：靈活構建強大查詢

MyBatis 動態 SQL 詳解：靈活構建強大查詢

MyBatis 的動態 SQL 功能是其最強大的特性之一，它允許開發者根據不同條件動態生成 SQL 語句，極大地提高了 SQL 的靈活性和復用性。本文將深入探討 MyBatis 的動態 SQL 功能，包括 OGNL 表達式的使用以及各種動態 SQL 元素（如 if、c…

閱讀更多...

嵌入式自學第三十天（5.28）

嵌入式自學第三十天（5.28）

（1）多線程資源競爭問題： 互斥：在多線程中對臨界資源的排他性訪問。解決方案：互斥鎖 mutex互斥鎖在進程pcb塊，ret 為0說明別人在用，1說明空閑。阻塞鎖 man pthread_mutex_init man pthread_…

閱讀更多...

【HW系列】—web常規漏洞（SQL注入與XSS）

【HW系列】—web常規漏洞（SQL注入與XSS）

SQL注入與XSS攻防解析（安全防御指南） 一、SQL注入基礎（防御視角） ??1. 簡介?? SQL注入是一種通過構造非預期SQL語句操縱數據庫的攻擊技術。作為開發者，需重點關注輸入驗證與查詢安全，建立全流量監測…

閱讀更多...

Accelerate 2025北亞巡展正式啟航！AI智御全球·引領安全新時代

Accelerate 2025北亞巡展正式啟航！AI智御全球·引領安全新時代

近日，網絡安全行業年度盛會Accelerate 2025北亞巡展正式在深圳啟航！智庫專家、產業領袖及Fortinet高管、產品技術團隊和300余位行業客戶齊聚一堂，圍繞“AI智御全球引領安全新時代”主題，共同探討AI時代網絡安全新范式。大會聚焦三…

閱讀更多...

RAG系統構建之嵌入模型性能優化完整指南

RAG系統構建之嵌入模型性能優化完整指南

導讀：在企業級RAG系統的實際部署中，您是否遇到過這樣的困擾：嵌入計算成本不斷攀升，API調用頻繁觸及限制，而系統響應速度卻始終達不到用戶期望？這些看似分散的問題，實際上都指向同一個技術核心&a…

閱讀更多...

python 自動生成不同行高的word

python 自動生成不同行高的word

python 自動生成不同行高的word # -*- coding: utf-8 -*- from docx import Document from docx.shared import Cm, Pt, Inches from docx.oxml import OxmlElement from docx.oxml.ns import qn from docx.enum.text import WD_ALIGN_PARAGRAPHclass DynamicTableGenerator:d…

閱讀更多...

如何訓練意志力

如何訓練意志力

設定清晰的目標目標需要是具體的，可實現的，有時間限制的。比如不要說“我要鍛煉”，而是改成“每周跑步3次，每次30分鐘”。從小事開始起步通常都是困難的，一開始定一個很大很復雜的任務也超出了自己的能力&#x…

閱讀更多...

FastAPI 依賴注入

FastAPI 依賴注入

依賴注入常用于以下場景： 共享業務邏輯（復用相同的代碼邏輯） 共享數據庫連接實現安全、驗證、角色權限等…… 上述場景均可以使用依賴注入，將代碼重復最小化。創建依賴項依賴項就是一個函數，且可以使用與路…

閱讀更多...

接口冪等性原理與方案總結

接口冪等性原理與方案總結

文章目錄接口冪等概念典型場景核心解決方案一鎖二判三更新方案選型對比接口冪等概念定義：無論調用接口多少次，對系統的影響與單次調用一樣范疇：在后端開發中，通常更關注寫接口的冪等，因為寫接口才會對系統數據造…

閱讀更多...

【已解決】windows gitbash 出現CondaError: Run ‘conda init‘ before ‘conda activate‘

【已解決】windows gitbash 出現CondaError: Run ‘conda init‘ before ‘conda activate‘

在 Git Bash 中執行： source /c/Users/你的用戶名/miniconda3/etc/profile.d/conda.sh # 注意填入你自己的路徑 conda init bash關閉并重新打開 Git Bash 終端。測試激活環境： conda activate your_env_name注意事項要把上述命令中的你的用戶名替…

閱讀更多...

軟件包管理系統的架構與生態機制

軟件包管理系統的架構與生態機制

文章目錄前言一、總結二、如何上傳自己的軟件包前言在日常軟件開發中，我們經常使用諸如apt install, pip install, npm install之類的命令，但有一個問題是，這些下載命令是從哪里下載的這些軟件包，以及我們是否能上傳自己的代碼…

閱讀更多...

Java線程池管理最佳實踐（設計模式）

Java線程池管理最佳實踐（設計模式）

引言在多線程編程中，線程池是一種非常重要的資源管理工具。合理使用線程池可以顯著提高系統性能，避免頻繁創建和銷毀線程帶來的開銷。今天，我將為大家深入分析一個實用的ThreadPoolManager實現，它來自com.kingdee.eas.util包&am…

閱讀更多...

4.8.2 利用Spark SQL計算總分與平均分

4.8.2 利用Spark SQL計算總分與平均分

在本次實戰中，我們的目標是利用Spark SQL計算學生的總分與平均分。首先，我們準備了包含學生成績的數據文件，并將其上傳至HDFS。接著，通過Spark的交互式編程環境，我們讀取了成績文件并將其轉換為結構化的DataFrame。然后…

閱讀更多...

最新文章