batch normalization和layer normalization區別

Normalization無非就是這樣一個操作:
在這里插入圖片描述
其中x是輸入數據,維度為(B,T,C),其中B是batchsize,T是序列長度,C是embedding維度;括號內是標準化操作,γ和β是仿射變換參數。

BN和LN的不同,僅僅在于均值和方差的計算方式而已,下面給出計算公式:

1.Batch Normalization

在這里插入圖片描述

2.Layer Normalization

在這里插入圖片描述
在這里插入圖片描述

可以發現,BN是對前2個維度進行統計計算,LN是對最后一個維度進行統計計算。公式很簡單,怎么理解呢?

先看LN。可以理解為:對于每個樣本(batch)中的每個token,都分別統計其自身所包含的所有特征維度,作為歸一化的依據。在大語言模型中,輸入序列的長度通常是不固定的,因此對每個 token 單獨進行歸一化,是一種更合理、靈活的方式。

再來看 BN,它更常用于固定長度的序列或圖像任務中。以等長序列為例,BN 的歸一化是對所有 batch 中相同位置(如第一個 token、第二個 token 等)上的特征維度進行統計。因此,它統計的是同一維度在不同樣本、不同 token 上的分布。由于序列長度一致,數據結構規整,就不需要像 LN 那樣對每個 token 單獨歸一化。

參考鏈接

https://arxiv.org/abs/2503.10622

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79525.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79525.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79525.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Postgresql源碼(144)LockRelease常規鎖釋放流程分析

相關 《Postgresql源碼(69)常規鎖細節分析》 最新遇到一個共享內存損壞導致常規鎖釋放報錯warning "you don’t own a lock of type"的問題。 本篇對常規鎖的概念做一些回顧,順便分析下釋放鎖的流程。 SpinLock:?LWL…

基于bert的情感分析程序

文章目錄 任務介紹數據概覽注意事項數據處理代碼準備模型構建與訓練模型類構建數據集構建數據批處理模型參數查看模型訓練結果推理與評估模型推理準確率評估附錄任務介紹 在當今信息爆炸的時代,互聯網上充斥著海量的文本數據,如社交媒體評論、產品評價、新聞報道等。這些文本…

宇樹科技舉辦“人型機器人格斗大賽”

2025 年 5 月至 6 月,一場全球矚目的科技盛宴 —— 全球首場 “人形機器人格斗大賽”,將由杭州宇樹科技盛大舉辦。屆時,觀眾將迎來機器人格斗領域前所未有的視覺震撼。 為打造最強參賽陣容,宇樹科技技術團隊在過去數周里&#xf…

計算機視覺與深度學習 | 什么是圖像金字塔?

圖像金字塔詳解 圖像金字塔 圖像金字塔詳解1. **定義**2. **原理與公式****2.1 高斯金字塔****2.2 拉普拉斯金字塔**3. **代碼示例****3.1 使用OpenCV實現****3.2 手動實現高斯模糊與降采樣**4. **應用場景**5. **關鍵點總結**1. 定義 圖像金字塔是一種多尺度圖像表示方法,將…

Spring MVC注解式控制器開發

主要對Spring MVC的核心注解的應用進行了詳細講解,介紹了Controller和RequestMapping注解類型的相關知識。 1.注解式控制器概念 Spring2.5之前,我們都是通過實現框架提供的Controller接口來定義我們的處理器類。 Spring2.5引入注解式處理器支持&#…

thonny提示自動補全功能

THONNY IDE 自動補全功能配置 在 Thonny IDE 中啟用和優化自動補全功能可以顯著提升編程體驗。為了確保該功能正常工作,需要確認幾個設置選項。 配置自動補全 Thonyy IDE 的自動補全默認情況下是開啟的。如果發現自動補全未按預期運行,可以通過調整首選…

D. 例題3.2.2 整數劃分問題

題目描述 將正整數n表示成一系列正整數之和:nn_1n_2...n_knn1?n2?...nk?,其中8\geq n_1\geq n_2\geq ...\geq n_k\geq 18≥n1?≥n2?≥...≥nk?≥1,k\geq1k≥1。正整數n的這種表示稱為正整數n的劃分。 例如正整數6有如下11種不同的劃分…

電腦RGB888P轉換為JPEG方案 ,K230的RGB888P轉換為JPEG方案

K230開發板本身具備將RGB888P轉換為JPEG的能力,但需要正確調用硬件或軟件接口。以下是具體分析及解決方案: 一、K230原生支持性分析 1. 硬件支持 K230的NPU(神經網絡處理器)和圖像處理單元(ISP)理論上支持…

圖解 Git 工作流:理解 Rebase、Merge 與 Pull Request 的區別

圖解 Git 工作流:理解 Rebase、Merge 與 Pull Request 的區別 在多人協作開發中,選擇合適的 Git 分支管理策略至關重要。Merge、Rebase 和 Pull Request 是最常見的三種方式,它們本質不同,使用場景也不同。 本文將通過流程圖&am…

Dart和Go語言特征對比

文章目錄 Dart 和 Go 語法對照表字符串常用方法對照列表(數組/切片)常用方法對照Map (字典/哈希表) 使用對照IO 操作對照文件操作標準輸入輸出網絡IO 主要差異說明 有同事說,我前端用Flutter,后端用Golang,都師出名門。但兩個語言還是老打架&…

ActiveMQ 集群搭建與高可用方案設計(二)

五、高可用方案設計與優化 (一)Zookeeper 在 ActiveMQ 集群中的應用 作用:在 ActiveMQ 集群中,Zookeeper 扮演著至關重要的角色。它主要用于選舉 Master 節點,通過其內部的選舉機制,從眾多的 ActiveMQ Br…

【項目歸檔】數據抓取+GenAI+數據分析

年后這兩個月頻繁組織架構變動,所以博客很久沒更新。現在暫時算是塵埃落定,趁這段時間整理一下。 入職九個月,自己參與的項目有4個,負責前后端開發,測試,devops(全棧/doge)&#xff…

服務器熱備份,服務器熱備份的方法有哪些?

服務器熱備份是保障業務連續性的重要技術手段,通過實時數據同步和快速故障切換,確保在主服務器故障時備份服務器能無縫接管。以下是常見的服務器熱備份方法及其核心要點: 雙機熱備(Active-Standby/Active-Active) 主備…

【AI平臺】n8n入門6:調用MCP服務(非社區節點)

前言 前邊用n8n搭建一個MCP服務,現在,用n8n調用其他服務商提供的MCP服務。本文以高德地圖服務為例,記錄一下操作過程。 實現案例功能 MCP是啥 MCP(Model Context Protocol,模型上下文協議)是由Anthropi…

基于ArduinoIDE的任意型號單片機 + GPS北斗BDS衛星定位

提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 文章目錄 前言1.1 器件選擇1.2 接線方案 二、驅動實現2.1 核心代碼解析(arduino/ESP32-S3) 三、坐標解析代碼四、典型問題排查總結 前言 北斗衛星導航…

經典算法 最小生成樹(prim算法)

最小生成樹 題目描述 給定一個 n 個點 m 條邊的無向圖,圖中可能存在重邊和自環,邊權可能為負數。 求最小生成樹的樹邊權重之和。如果最小生成樹不存在,則輸出 impossible。 給定一張邊帶權的無向圖 G (V, E),其中&#xff1a…

LeetCode算法題 (設計鏈表)Day16!!!C/C++

https://leetcode.cn/problems/design-linked-list/description/ 一、題目分析 你可以選擇使用單鏈表或者雙鏈表,設計并實現自己的鏈表。 單鏈表中的節點應該具備兩個屬性:val 和 next 。val 是當前節點的值,next 是指向下一個節點的指針/引…

《解鎖GCC版本升級:開啟編程新世界大門》

《解鎖GCC版本升級:開啟編程新世界大門》 一、引言:GCC 版本升級的魔法鑰匙 在編程的廣闊天地里,GCC(GNU Compiler Collection)宛如一座燈塔,為無數開發者照亮前行的道路。它是一款開源且功能強大的編譯器集合,支持 C、C++、Objective - C、Fortran、Ada 等多種編程語言…

toLua筆記

基本 LuaState luaStatenew LuaState(); luaState.Start(); luaState.DoString("xxx"); luaState.DoFile("yyy.lua"); luaState.Require("zzz");//不要加.lua后綴 luaState.CheckTop();//檢查解析器棧頂為空 luaState.Dispose(); luaStatenull;…

go實現雙向鏈表

需求 實現雙向鏈表的節點生成、正反向遍歷、指定刪除。 實現 package mainimport ("fmt" )type zodiac_sign struct {number intdizhi stringanimal stringyear intprevious *zodiac_signnext *zodiac_sign }// 添加 // func add_node_by_order(pr…