歸一化實現原理

歸一化(Normalization)是一種將數據轉換到相同尺度的預處理技術,它通常用于讓不同特征(或數據項)具有相同的量綱或范圍。在聯邦學習中,歸一化可以用來處理非獨立同分布(Non-IID)**數據中的差異,確保不同客戶端的訓練過程具有可比性,從而有效地提高模型的穩定性和準確性

1. 歸一化的基本概念

歸一化的目標是將數據縮放到特定的范圍內,常見的范圍是 [0, 1] 或 [-1, 1]。通過這種方式,可以消除數據中由于量綱差異或尺度差異帶來的影響,使得不同客戶端的梯度或損失值在同一個尺度上進行比較。

常用的歸一化方法有:

  • 最小-最大歸一化(Min-Max Normalization):將數據縮放到指定的范圍(通常是 [0, 1])。

  • Z-score標準化(Z-score Normalization):通過數據的均值和標準差對數據進行標準化。

2. 最小-最大歸一化(Min-Max Normalization)

最小-最大歸一化是最常用的歸一化方法之一。它將數據按比例縮放到 [0, 1] 之間,公式如下:

其中:

  • X?是原始數據(例如,客戶端的損失值或梯度值)。

  • X_{\text{min}}X_{\text{max}} 分別是數據中的最小值和最大值。

  • X_{\text{normalized}}是歸一化后的數據。

例子解釋

假設5個客戶端的損失值如下:

客戶端損失值
A0.8
B1.2
C0.9
D0.7
E5.0
  • 最小值X_{\text{min}}) = 0.7

  • 最大值X_{\text{max}}) = 5.0

那么,歸一化后的損失值計算如下:

最終的歸一化損失值如下:

客戶端原始損失值歸一化后損失值
A0.80.0233
B1.20.1163
C0.90.0465
D0.70
E5.01

通過歸一化方法,所有客戶端的損失值都被縮放到了相同的范圍內,便于進行比較。

3. Z-score標準化

Z-score標準化是另一種常見的數據歸一化方法,它將數據變換為均值為0、標準差為1的分布。公式如下:

其中:

  • X 是原始數據(例如,客戶端的損失值或梯度值)。

  • \mu 是數據的均值(所有數據的平均值)。

  • \sigma 是數據的標準差(數據的離散程度)。

例子解釋

假設使用上述的損失值(A: 0.8, B: 1.2, C: 0.9, D: 0.7, E: 5.0)。

標準化后的值

最終的標準化結果:

客戶端原始損失值標準化后損失值
A0.8-0.556
B1.2-0.313
C0.9-0.494
D0.7-0.612
E5.01.993

通過Z-score標準化后,所有客戶端的損失值以均值0、標準差1的方式呈現,避免了數據尺度對分析的影響。

4. 選擇哪種歸一化方法?

  • 最小-最大歸一化:適用于你已知數據的范圍,并且希望將所有數據縮放到一個固定范圍內。通常用于算法對特定范圍敏感的情況,比如在神經網絡中,激活函數(如Sigmoid)通常對歸一化數據較為敏感。

  • Z-score標準化:適用于數據分布較為復雜,或者你不確定數據的范圍時。它不受到極端值的影響,適用于大多數基于距離的算法(如KNN、SVM等)和一些優化算法。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/98073.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/98073.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/98073.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

企業級實戰:構建基于Qt、C++與YOLOv8的模塊化工業視覺檢測系統

一、概述 在追求高效與精密的現代制造業中,自動化光學檢測(AOI)已成為保障產品質量的核心技術。傳統的質檢流程往往受限于人工效率與主觀判斷,難以滿足大規模、高精度的生產需求。本文旨在研發一套完整的、企業級的工業視覺異常檢…

【目標檢測】metrice_curve和loss_curve對比圖可視化

代碼如下: import warnings warnings.filterwarnings(ignore)import os import pandas as pd import numpy as np import matplotlib.pylab as pltpwd os.getcwd()names [model1, model2, model3,ours]plt.figure(figsize(10, 10))plt.subplot(2, 2, 1) for i in …

【LeetCode hot100|Week2】滑動窗口,子串

筆記用于個人復習和鞏固,題解非原創,參考LeetCode官方題解以及各個大佬的解法,希望給大家帶來幫助,同時筆記也能督促我學習進步 這周主要把滑動窗口和子串的題目刷了一遍 文章目錄Week2D1 滑動窗口209. 長度最小的子數組713. 乘積…

vue2純前端對接海康威視攝像頭實現實時視頻預覽

vue2純前端對接海康威視攝像頭實現實時視頻預覽一、環境準備二、代碼集成1.1 準備webrtcstreamer.js,粘貼即用,不用做任何修改1.2 封裝視頻組件,在需要視頻的地方引入此封裝的視頻組件即可,也是粘貼即用,注意其中impor…

Android 設置禁止截圖和禁止長截圖

1.禁止截圖 在 Activity 代碼中 , 可以在調用 setContentView 函數之前 ,為 Window 窗口對象 設置 LayoutParams.FLAG_SECURE 標志位 , 可以禁止對本界面進行截屏 ,Window 窗口對象 , 可通過 getWindow 方法獲取 ,核心代碼如下 :getWindow().setFlags(LayoutParams.FLAG_SECUR…

AR 巡檢在工業的應用|阿法龍XR云平臺

AR 巡檢的應用覆蓋電力、石油化工、智能制造、軌道交通、冶金等對設備可靠性和安全性要求極高的行業,具體場景包括:電力行業變電站內設備的狀態檢查:通過 AR 眼鏡掃描設備,實時顯示設備額定參數、歷史故障記錄、實時傳感器數據&am…

【C++】STL詳解(七)—stack和queue的介紹及使用

? 堅持用 清晰易懂的圖解 代碼語言, 讓每個知識點都 簡單直觀 ! 🚀 個人主頁 :不呆頭 CSDN 🌱 代碼倉庫 :不呆頭 Gitee 📌 專欄系列 : 📖 《C語言》🧩 《…

深度學習周報(9.8~9.14)

目錄 摘要 Abstract 1 LSTM相關網絡總結與對比 1.1 理論總結 1.2 代碼運行對比 2 量子計算入門 3 總結 摘要 本周首先總結了LSTM、Bi-LSTM與GRU的區別與優缺點,對比了三者實戰的代碼與效果,還另外拓展了一些循環神經網絡變體(包括窺視…

Quat 四元數庫使用教程:應用場景概述

基礎概念 四元數是一個包含四個元素的數組 [x, y, z, w],其中 x,y,z表示虛部,w 表示實部。單位四元數常用于表示3D空間中的旋轉。 1. 創建和初始化函數 create() - 創建單位四元數 應用場景:初始化一個新的四元數對象,通常作為其他…

【Java后端】Spring Boot 多模塊項目實戰:從零搭建父工程與子模塊

如何用 Spring Boot 搭建一個父工程 (Parent Project),并在其中包含多個子模塊 (Module),適合企業級項目或者需要分模塊管理的場景。Spring Boot 多模塊項目實戰:從零搭建父工程與子模塊在日常開發中,我們經常會遇到這樣的需求&am…

企業級AI會議系統技術實現:快鷺如何用AI重構會議全流程

摘要 本文深度解析快鷺AI會議系統的核心技術架構,重點探討其在語音識別、自然語言處理、數據集成和安全防護等方面的技術實現。通過對比傳統會議系統的技術痛點,分析快鷺AI如何通過技術創新實現會議籌備時間減少67%、數據調取速度提升100倍的顯著效果。…

【CSS學習筆記3】css特性

1css三大特性 1.1層疊性:就近原則,最新定義的樣式 1.2繼承性:子標簽集成父標簽的樣式,如文本和字號 行高的繼承:不加單位指的是當前文字大小的倍數 body {font: 12px/1.5 Microsoft YaHei;color: #be1313;} div {…

[C語言]常見排序算法①

1.排序的概念及常見的排序算法排序在咱們日常生活中十分的常見,就好比是網上購物的時候通常能夠選擇按照什么排序,比如價格、評論數量、銷量等。那么接下來咱們就來了解一些關于排序的概念。排序:所謂排序,就是使一串記錄&#xf…

文獻閱讀筆記:RS電子戰測試與測量技術文檔

信息來源:羅德與施瓦茨(Rohde & Schwarz)公司關于電子戰(Electronic Warfare, EW)測試與測量解決方案專業技術文檔。 該文檔由臺灣地區應用工程師Mike Wu撰寫,核心圍繞電子戰基礎、雷達系統、實戰應用及…

別再糾結 Postman 和 Apifox 了!這款開源神器讓 API 測試更簡單

別再糾結 Postman 和 Apifox 了!這款開源神器讓 API 測試更簡單🔥 作為一名開發者,你是否還在為選擇 API 測試工具而糾結?Postman 太重、Apifox 要聯網、付費功能限制多?今天給大家推薦一款完全免費的開源替代方案 ——…

微調神器LLaMA-Factory官方保姆級教程來了,從環境搭建到模型訓練評估全覆蓋

1. 項目背景 開源大模型如LLaMA,Qwen,Baichuan等主要都是使用通用數據進行訓練而來,其對于不同下游的使用場景和垂直領域的效果有待進一步提升,衍生出了微調訓練相關的需求,包含預訓練(pt)&…

創建其他服務器賬號

? 在 /home74 下創建新用戶的完整步驟1. 創建用戶并指定 home 目錄和 shellsudo useradd -m -d /home74/USERNAME -s /bin/bash USERNAME-m:自動創建目錄并復制 /etc/skel 默認配置文件(.bashrc 等)。-d:指定用戶 home 路徑&…

【WebGIS】Vue3使用 VueLeaflet + 天地圖 搭建地圖可視化平臺(基礎用法)

初始化 創建項目 nodejs 18.0.6npm 9.5.1 引入地圖服務 VueLeaflet GitHub - vue-leaflet/vue-leaflet: vue-leaflet 與 vue3 兼容 Vue Leaflet (vue2-leaflet) package.josn安裝版本 直接添加四個依賴 {// ..."scripts": {// ...},"depen…

OpenCV 開發 -- 圖像閾值處理

文章目錄[toc]1 基本概念2 簡單閾值處理cv2.threshold3 自適應閾值處理cv2.adaptiveThreshold更多精彩內容👉內容導航 👈👉OpenCV開發 👈1 基本概念 圖像閾值處理(Thresholding)是圖像處理中的一種基本技術…

單串口服務器-工業級串口聯網解決方案

在工業自動化、智能電網、環境監測等領域,傳統串口設備(如PLC、傳感器、儀表等)的網絡化升級需求日益增長。博為智能單串口服務器憑借高性能硬件架構、多協議支持和工業級可靠性,為RS485設備提供穩定、高效的TCP/IP網絡接入能力&a…