數據歸一化

news/2025/7/28 2:47:55/文章來源:https://blog.csdn.net/weixin_33730836/article/details/93288973

數據歸一化

?????? 數據的標準化是將數據按比例縮放，使之落入一個小的特定區間，一般為0到1之間。在某些比較和評價的指標處理中經常會用到，去除數據的單位限制，將其轉化為無量綱的純數值，便于不同單位或量級的指標能夠進行比較和加權。

　　常見的數據歸一化的方法有：

1.min-max標準化(離差標準化)

　　是對原始數據的線性變換，使結果落到[0,1]區間，轉換函數如下：

　　其中max為樣本數據的最大值，min為樣本數據的最小值。這種方法有一個缺陷就是當有新數據加入時，可能導致max和min的變化，需要重新定義。

2.log函數轉換

　　通過以10為底的log函數轉換的方法同樣可以實現歸一下，具體方法如下：

　看了下網上很多介紹都是x^*=log₁₀(x)，其實是有問題的，這個結果并非一定落到[0,1]區間上，應該還要除以log₁₀(max)，max為樣本數據最大值，并且所有的數據都要大于等于1。

3.atan函數轉換

　　用反正切函數也可以實現數據的歸一化：

　　使用這個方法需要注意的是如果想映射的區間為[0,1]，則數據都應該大于等于0，小于0的數據將被映射到[-1,0]區間上。

　　而并非所有數據標準化的結果都映射到[0,1]區間上，其中最常見的標準化方法就是Z標準化，也是SPSS中最為常用的標準化方法：

4.z-score 標準化(標準差標準化)

　　經過處理的數據符合標準正態分布，即均值為0，標準差為1，其轉化函數為：

　　其中μ為所有樣本數據的均值，σ為所有樣本數據的標準差。

?

?

??? 那么明天的任務就有了——數據歸一化

轉載于:https://www.cnblogs.com/jjuiipg2017/p/7096719.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/281660.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/281660.shtml
英文地址，請注明出處：http://en.pswp.cn/news/281660.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

vi is failed with error E382: Cannot write, 'buftype' option is set in Linux

vi is failed with error E382: Cannot write, 'buftype' option is set in Linux

在linux下生成jar文件遇到了編碼問題，于是想vi t.jar，在保存是報錯：E382: Cannot write, buftype option is set 解決方法： 可以用下面的命名查看buftype的設置，當buftypenofile時，不能保存文件&#xff0c…

閱讀更多...

列表生成式的使用

列表生成式的使用

輸入：[Hello, World, 18, Apple, None] 輸出：[hello, world, apple] L [Hello, World, 18, Apple, None] print([w.lower() for w in L if isinstance(w, str)])# -- coding: utf-8 -- L [Hello, World, 18, Apple, None] L2 [] L2 [w.lower() for w…

閱讀更多...

matlab 12位顯示不出來,求助大神，為何不同機器運行MATLAB結果不同

matlab 12位顯示不出來,求助大神，為何不同機器運行MATLAB結果不同

求助：不同機器運行MATLAB結果不同我調用MATLAB優化工具箱的庫函數fmincon，使用相同的初始解(可行解)，對同一個問題進行局部搜索(算法為序列二次規劃，即SQP)，但在不同機器上得到的結果不同。一共有五臺機器 (為了方便&a…

閱讀更多...

.NET性能系列文章一：.NET7的性能改進

.NET性能系列文章一：.NET7的性能改進

這些方法在.NET7 中變得更快照片來自 CHUTTERSNAP[1] 的 Unsplash[2]歡迎閱讀.NET 性能系列的第一章。這一系列的特點是對.NET 世界中許多不同的主題進行研究、比較性能。正如標題所說的那樣，本章節在于.NET7 中的性能改進。你將看到哪種方法是實現特定功能最快的方…

閱讀更多...

UVA - 10061 How many zero#39;s and how many digits ?

UVA - 10061 How many zero#39;s and how many digits ?

n!x*b^y, 當x為正整數時,最大的y就是n!末尾0的個數了, 把n,b分別拆成素因子相乘的形式: 比如, n5,b16 n5,b2^4, 非常明顯,末尾0的個數為0 10進制時,n!a*10^x b進制時,n!c*b^y 非常明顯,n!的位數就是最大的x1 這里計算我用了log,精度設置為1e-9 #include<iostream> #inclu…

閱讀更多...

丁洪波 -- 不要“ 總是拿著微不足道的成就來騙自己”

丁洪波 -- 不要“ 總是拿著微不足道的成就來騙自己”

都市快報實盤大賽25期：于海飛/丁洪波榮獲冠亞軍七禾網時間：2010-11-02 12:47:05 來源：期貨中國10月30日下午，2010年浙商期貨實盤大賽第三季度（都市快報實盤大賽第25期）頒獎典禮在天科大廈浙商期貨大會議室…

閱讀更多...

面試專題（Mysql及Mongodb）

面試專題（Mysql及Mongodb）

2019獨角獸企業重金招聘Python工程師標準>>> mysql面試題 1. 各個數據庫存儲引擎區別 mysql的存儲引擎是針對表進行設置的，一個庫的不同表可以設置不同的存儲引擎，mysql默認支持多種存儲引擎，以適用不同領域的數據庫應用需要&…

閱讀更多...

織夢網站翻頁php,dedecms織夢網站列表頁和內容頁分頁樣式

織夢網站翻頁php,dedecms織夢網站列表頁和內容頁分頁樣式

織夢分頁標簽{dede:pagelist istitem"index,pre,next,end,option,info," listsize"5"/}，{dede:prenext getpre/}，{dede:prenext getnext/}。默認樣式和使用模板css樣式布局不一樣,這時又不想重寫樣式，我們可以修改織夢標…

閱讀更多...

通過中間件添加用戶的Claim

通過中間件添加用戶的Claim

本文主要介紹 Sang.AspNetCore.RoleBasedAuthorization[1] 庫如何通過中間件實現對用戶 Claim 的添加。背景前面我們介紹了通過對自定義授權策略和自定義授權處理程序的使用實現了基本的RBAC權限設計，將大量的用戶可訪問資源及操作的標識直接放到用戶的 JWT Token 中…

閱讀更多...

部署也是工程的一部分，也要編程（自動化）

部署也是工程的一部分，也要編程（自動化）

部署和開發一樣，同樣面臨變化。同樣有復雜的細節。同樣應該代碼化，自動化。把復雜性、思路，操作，都固化下來，顯式表達。不要“雪花”式配置。把最近看的文章摘抄一下集句： 1頻繁做讓你感到痛苦的事情&a…

閱讀更多...

KDD走進阿里數百專家聚集探討產學研一體化

KDD走進阿里數百專家聚集探討產學研一體化

6月29日，由阿里巴巴集團、中國中文信息學會、KDD China聯合主辦的數據挖掘前沿發展與未來論壇在杭州舉行，會議吸引了來自國際頂級高校和知名企業的近300名專家學者到場參會、近30000人在線觀看。論壇除了分享最新的數據挖掘領域最新科研成果及研發思路外…

閱讀更多...

zookeeper學習03 使用場景

zookeeper學習03 使用場景

zookeeper實際應用場景 zookeeper能夠實現哪些場景 1）訂閱發布/配置中心 watcher機制統一配置管理（disconf） 實現配置信息的集中式原理和數據的動態更新實現配置中心有倆種模式：push,pull 長輪詢 zookeeper采用的是推拉相結合的…

閱讀更多...

php模板引擎循環start,PHP模板引擎Smarty內建函數section,sectionelse用法詳解

php模板引擎循環start,PHP模板引擎Smarty內建函數section,sectionelse用法詳解

本文實例講述了PHP模板引擎Smarty內建函數section,sectionelse用法。分享給大家供大家參考，具體如下：section 是 Smarty 模板中除了 foreach 以外的另一種處理循環的方案，section 比 foreach 要靈活，就像是一個改進的 foreach 語句…

閱讀更多...

OpenHarmony操作系統與龍芯2K1000LA芯片完成適配，龍架構平臺獲得開源鴻蒙認證

OpenHarmony操作系統與龍芯2K1000LA芯片完成適配，龍架構平臺獲得開源鴻蒙認證

近日，龍芯中科與軟通動力控股公司鴻湖萬聯共同完成OpenHarmony操作系統與龍芯2K1000LA處理器的適配，“乘風1000”開發板（搭載龍芯2K1000LA）榮獲OpenHarmony生態產品兼容性證書。至此，萬物互聯的OpenHarmony生態體系再次…

閱讀更多...

struts2開發action 的三種方法以及通配符、路徑匹配原則、常量

struts2開發action 的三種方法以及通配符、路徑匹配原則、常量

struts2開發action 的三種方法 1、繼承ActionSupport public class UserAction extends ActionSupport {// Action中業務處理方法public String login() {System.out.println("UserAction.login()"); // return "success";return SUCCESS;} } 2、實現…

閱讀更多...

閉包--閉包作用之保護(一)

閉包--閉包作用之保護(一)

閉包作用:保護形成私有作用域,保護里面的私有變量不受外界干擾例如多人協作開發：A的代碼有fn(),B的代碼有fn(),但是他們不相互影響 // A的代碼<script>(function() {function fn1() {console.log("aa")}window.fn1 fn1;})()// window.fn1() //11&…

閱讀更多...

left join 和 inner join

left join 和 inner join

2019獨角獸企業重金招聘Python工程師標準>>> left join 和 inner join 首先 MySQL 中 inner join 的效率確實要高于 left join。所以沒必要使用 left join 轉彎成 inner join 的效果。這樣不但效率降低，可讀性也會降低。 Number1 select from t1 left j…

閱讀更多...

oracle 數據庫中拆分,oracle數據庫字符串拆分

oracle 數據庫中拆分,oracle數據庫字符串拆分

第一種直接返回切分的字符串create or replace function Get_StrArrayLength(av_str varchar2,--要分割的字符串av_split varchar2 --分隔符號)return numberislv_str varchar2(1000);lv_length number;beginlv_str:ltrim(rtrim(av_str));lv_length:0;while instr(lv_str,av_s…

閱讀更多...

Vue3+.NET6，輕松開發管理后臺！（可復用）

Vue3+.NET6，輕松開發管理后臺！（可復用）

在GitHub是沒找到簡單好用的Vue3.NET6管理后臺項目，有收藏的請評論區分享。這里分享一套Vue3 Axios TS Vite Element Plus .NET 6 WebAPI JWT SqlSugar的通用管理后臺，前后端分離架構，各種最新框架組件，實現了管理后臺幾乎…

閱讀更多...

iOS網絡請求安全認證（JWT，RSA）

iOS網絡請求安全認證（JWT，RSA）

在網絡世界中，安全是一個很重要的問題，以往的HTTP請求已經不能承擔這個安全任務，抓包工具一抓，你的所有網絡請求全都曝光。當然，你可能會采用加密算法來加密數據，但是這仍然不夠。在移動端和服務器的通信過…

閱讀更多...

最新文章