可用于多元正態的參數估計 及 均值向量和協差陣檢驗 的R語言函數總結

一、多元正態的參數估計

1.1 樣本均值

? ? ? ? 在R語言中,均值通常用函數mean()得到,但是mean()只能計算一維變量的樣本均值,在面對多元隨機變量的樣本時,假設我們以數據框的形式保存樣本,我們有以下方法可以得到樣本均值:

  1. 對多元樣本的每一個分量用mean()函數,可以用apply()或sapply()函數
  2. 以數據框類型保存的樣本,可以用summary()函數返回各個變量的各項描述性數據,其中包括均值

例1.1:

? ? ? ??計算有割草機家庭的樣本均值向量

有割草機家庭無割草機家庭
x1x2x1x2
20.09.225.09.8
28.58.417.610.4
21.610.821.68.6
20.510.414.410.2
29.011.828.08.8
36.79.616.48.8
36.08.819.88.0
27.611.222.09.2
23.010.015.88.2
31.010.411.09.4
17.011.017.07.0
27.010.021.07.4

?注:在輸入數據時,通常會用一個新的變量(假設命名為Y)來表示每個觀測所屬的組,稱為分組變量,這個變量在R中通常要轉換成因子

> data4.1=read.csv('Table4-1.csv')
> head(data4.1)
###                y是分組變量,y=1表示有割草機家庭x1   x2 y
1  20.0  9.2 1
2  28.5  8.4 1
3  21.6 10.8 1
4  20.5 10.4 1
5  29.0 11.8 1
6  36.7  9.6 1
###
> apply(data4.1[data4.1$y==1,],2,mean)[1:2]    #用apply()函數運算
###x1       x2 
26.49167 10.13333 
###
> summary(data4.1[data4.1$y==1,])           #用summary()獲取各分量的樣本均值
###x1              x2              y    Min.   :17.00   Min.   : 8.40   Min.   :1  1st Qu.:21.32   1st Qu.: 9.50   1st Qu.:1  Median :27.30   Median :10.20   Median :1  Mean   :26.49   Mean   :10.13   Mean   :1   #該行為均值3rd Qu.:29.50   3rd Qu.:10.85   3rd Qu.:1  Max.   :36.70   Max.   :11.80   Max.   :1 
###
  • apply()用法:apply(A,margin,fun,...)?

? ? ? ? apply()函數用來對矩陣或數據框的每行或每列進行指定函數的運算。其中A為矩陣或數據框;margin指定對行或對列進行運算,當margin=1時對行進行運算,當margin=2時對列進行運算;fun是指定的函數?

  • summary()用法:summary(object,...)

? ? ? ? summary()多用于獲取項目的摘要,包含部分信息。當object為數據框時,會返回各個變量的五數(最小值,下四分位數,中位數,上四分為數,最大值)和均值

1.2 樣本協差陣

? ? ? ? 在R中,樣本協差陣的獲取非常簡便, 對數據框使用cov()函數即可

例1.2:

? ? ? ? 繼上題,計算有割草機組的樣本協差陣

> cov(data4.1[data4.1$y==1,][,1:2])
###x1        x2
x1 39.182652 -1.969697
x2 -1.969697  1.020606
###
  • cov()用法:cov(x,y=NULL,...)

? ? ? ? 當指定cov()的參數x和y,且兩者都為一維向量時,會返回兩個向量的樣本協方差;而未指定參數y,且x為矩陣或數據框時,會返回以x每一列作為變量樣本的協差陣

1.3? 樣本相關陣

? ? ? ? 獲取樣本相關陣的函數是cor(),其用法與cov()相同,兩個一維向量返回相關系數;數據框返回相關陣

二、各類檢驗

2.1 正態性檢驗

? ? ? ? 正態性檢驗即檢驗樣本是否來自正態總體的檢驗,原假設都為來自正態總體。正態性的檢驗方法有許多種,此處介紹小樣本量(3~50)時所用的夏皮洛-威爾克檢驗。R中的夏皮洛-威爾克檢驗的函數為shapiro.test()

? ? ? ? shapiro.test()一次只能對一維變量進行正態性檢驗,當面對多元隨機變量的樣本時,有以下方法

  1. 我們可以對其每一個分量都進行一次正態性檢驗,當所有分量都檢驗得出服從正態分布后,可以認為該多元隨機變量服從多元正態分布
  2. 運用mvnormtest包內的mshapiro.test()函數進行多元正態性檢驗

????????實現時可能會用到的函數有:

  • sapply(),對每個分量進行指定的檢驗
  • tapply(),對以分組變量指定的不同組別分別進行指定的檢驗

例2.1:

? ? ? ? 繼上題,對不同類型家庭的隨機向量數據進行正態性檢驗

> sapply(data4.1[,-3],shapiro.test)    #對各分量進行正態性檢驗,但是未分組
###x1                            x2                           
statistic 0.9654387                     0.9880936                    
p.value   0.5568611                     0.9897171                    
method    "Shapiro-Wilk normality test" "Shapiro-Wilk normality test"
data.name "X[[i]]"                      "X[[i]]" 
###
> tapply(data4.1[,1],data4.1$y,shapiro.test)
###                            對分組后的x1進行正態性檢驗
$`0`Shapiro-Wilk normality testdata:  X[[i]]
W = 0.98551, p-value = 0.9971$`1`Shapiro-Wilk normality testdata:  X[[i]]
W = 0.95332, p-value = 0.6859###
> tapply(data4.1[,2],data4.1$y,shapiro.test)
###                            對分組后的x2進行正態性檢驗
$`0`Shapiro-Wilk normality testdata:  X[[i]]
W = 0.97557, p-value = 0.9596$`1`Shapiro-Wilk normality testdata:  X[[i]]
W = 0.98262, p-value = 0.992
###
##對有割草機家庭的隨機向量數據進行正態性檢驗
> mshapiro.test(t(as.matrix(data4.1[data4.1$y==1,-3])))Shapiro-Wilk normality testdata:  Z
W = 0.96877, p-value = 0.8975##對無割草機家庭的隨機向量數據進行正態性檢驗
> mshapiro.test(t(as.matrix(data4.1[data4.1$y==0,-3])))Shapiro-Wilk normality testdata:  Z
W = 0.98001, p-value = 0.9837

?????????檢驗結果為均服從正態分布


  • sapply():sapply(X,Fun,...)

? ? ? ? sapply()用于對X的每個分量進行Fun函數運算,X應該是矩陣或數據框

  • tapply():tapply(X,Index,Fun=NULL,...)

? ? ? ? tapply()用于對以分組變量Index指示的每個組中對應的X的數據進行Fun函數運算

  • mshapiro.test():mshapiro.test(U)

? ? ? ? mshapiro.test()用于進行多元的夏皮洛-威爾克正態性檢驗,需要注意U只能是數據矩陣,當遇到用數據框存儲的數據時要用as.matrix()轉化為矩陣,且這個函數默認變量的數據按行排放,通常我們需要對矩陣再進行一次轉置

? ? ? ? 另外,可以畫出Q-Q圖查看樣本的正態性,常用的函數有qqnorm()和qqline()

  • qqnorm(x),其中x為一維變量的樣本,當畫出的散點圖越接近一條斜線,其正態性越強
  • qqline(x),其中x為一維變量的樣本,當畫出散點的Q-Q圖后,添加點所靠近的斜線,該斜線的斜率為標準差,截距為均值

2.2? 均值向量的檢驗

? ? ? ? 一維的均值檢驗有很多,若樣本服從正態分布我們可以用t.test()單個總體或雙總體的t檢驗;若不服從正態分布,我們可以用wilcox.test()進行秩和檢驗,用法與t.test()類似;當遇到多個總體時,若各個變量的方差相差不大,我們可以用將各個變量的數據放到一列,然后用一個分組變量表示數據屬于哪個變量,運用aov()進行方差分析,從而進行多總體的均值檢驗

? ? ? ? 當遇到多元隨機變量的均值檢驗時,我們有以下方法:

  1. 對每個分量進行均值檢驗,通過正態性檢驗的用t檢驗,未通過正態性檢驗的用秩和檢驗
  2. 對通過多元正態檢驗的數據,運用ICSNP包中的HotellingsT2()函數進行均值向量的檢驗
  3. 多總體時,若協差陣齊性檢驗通過,可以用manova()進行多元方差分析

?例2.2.1:

? ? ? ? 繼上題,檢驗有割草機家庭和無割草機家庭的向量均值是否相同

#上題已得出各類家庭的數據均通過正態檢驗> t.test(x1~y,data=data4.1)            #對x1分量進行t檢驗Welch Two Sample t-testdata:  x1 by y
t = -3.2508, df = 20.458, p-value = 0.003919
alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
95 percent confidence interval:-12.073229  -2.643437
sample estimates:
mean in group 0 mean in group 1 19.13333        26.49167 > t.test(x2~y,data=data4.1)            #對x2分量進行t檢驗Welch Two Sample t-testdata:  x2 by y
t = -3.1203, df = 21.956, p-value = 0.004991
alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
95 percent confidence interval:-2.1918725 -0.4414609
sample estimates:
mean in group 0 mean in group 1 8.816667       10.133333 > library(ICSNP)
> attach(data4.1)
> HotellingsT2(cbind(x1,x2)~y)            #霍特林T方檢驗,用于多元正態向量Hotelling's two sample T2-testdata:  cbind(x1, x2) by y
T.2 = 12.257, df1 = 2, df2 = 21, p-value = 0.000297
alternative hypothesis: true location difference is not equal to c(0,0)

????????對各分量進行t檢驗的結果是:有割草機家庭與無割草機家庭的兩個分量都不相等?

????????對向量整體進行霍特林T方檢驗的結果是:有割草機家庭與無割草機家庭的向量均值不相等

? ? ? ? ?該題也可以用多元方差分析,只是水平數為2,其實也是通過對每個分量進行檢驗


例2.2.2:

????????現有如下表所示各省統計數據,試檢驗它們的均值向量是否等于? (1081,1822,115,179)

序號

省份

工資性收入

家庭性收入

財產性收入

轉移性收入

1

北京

4524.25

1778.33

588.04

455.64

2

天津

2720.85

2626.46

152.88

79.64

3

河北

1293.50

1988.58

93.74

105.81

4

山西

1177.94

1563.52

62.70

86.49

5

內蒙古

504.46

2223.26

73.05

188.10

6

遼寧

1212.20

2163.49

113.24

201.28

注:以上為部分表格,表格全部內容在此不展示

> data3=read.csv('Table_0.csv',encoding='UTF-8')    #讀取數據
> mu_bar=c(1081,1882,115,179)
> rownames(data3)=data3[,1]            #將省名賦給數據框行名
> data3=data3[,-1]                     #去除省名一列
###
假設通過了正態性檢驗
###
> HotellingsT2(data3,mu=mu_bar)Hotelling's one sample T2-testdata:  data3
T.2 = 1.8443, df1 = 4, df2 = 27, p-value = 0.1494
alternative hypothesis: true location is not equal to c(1081,1882,115,179)

????????檢驗結果為各省統計數據的均值向量等于(1081,1822,115,179)


例2.2.3:

在數據New drug.xls中,各變量的意義為drug(藥),取值1表示對病人給以新藥,取值2表示對病人給以安慰劑,resp1-resp3是治療后病人三個時點的呼吸狀況,pulse1-pulse3是病人三個時點的脈搏。試分析這兩方法的各次重復測定均值向量是否有顯著差異?

drugresp1resp2resp3pulse1pulse2pulse3
13.43.33.32.22.12.1
13.43.43.32.22.12.2
13.33.43.42.32.42.3
23.33.33.32.82.92.7
23.23.33.42.62.72.7
23.23.23.22.72.92.7

?注:以上為部分表格,表格全部內容在此不展示

? ? ? ? 題目要求檢驗不用用藥的組之間,向量(resp1,resp2,resp3,pulse1,pulse2,pulse3)的均值是否相等。因為drug只有2個水平,可以對每個分量進行t檢驗,但是分量比較多會比較麻煩;也可以用多元方差分析,查看結果也是對每個分量的檢驗,不過需要先進行協差陣檢驗;用霍特林T2檢驗會比較簡單。

> data_drug=read.csv('new drug.csv',encoding='UTF-8')
> names(data_drug)[1]='drug'        #UTF-8格式的csv文件讀取后,第一列的名字會有變動,此處改回
> attach(data_drug)
###
對每個變量進行正態性檢驗后
得知隨機向量不服從多元正態分布
因此不能用t檢驗和霍特林T方檢驗,不過可以對每個分量進行秩和檢驗
假設數據通過了協差陣檢驗
接下來進行多元方差分析
###
> modle_drug=manova(cbind(resp1,resp2,resp3,pulse1,pulse2,pulse3)~drug,data=data_drug)
> summary.aov(modle_drug)Response resp1 :Df   Sum Sq  Mean Sq F value   Pr(>F)   
drug         1 0.040833 0.040833  14.412 0.003507 **
Residuals   10 0.028333 0.002833                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Response resp2 :Df   Sum Sq  Mean Sq F value   Pr(>F)   
drug         1 0.040833 0.040833  14.412 0.003507 **
Residuals   10 0.028333 0.002833                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Response resp3 :Df   Sum Sq   Mean Sq F value Pr(>F)
drug         1 0.020833 0.0208333  3.0488 0.1114
Residuals   10 0.068333 0.0068333               Response pulse1 :Df  Sum Sq Mean Sq F value    Pr(>F)    
drug         1 0.65333 0.65333      70 7.936e-06 ***
Residuals   10 0.09333 0.00933                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Response pulse2 :Df  Sum Sq Mean Sq F value    Pr(>F)    
drug         1 1.08000 1.08000  79.024 4.623e-06 ***
Residuals   10 0.13667 0.01367                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Response pulse3 :Df  Sum Sq Mean Sq F value    Pr(>F)    
drug         1 0.75000 0.75000  64.286 1.155e-05 ***
Residuals   10 0.11667 0.01167                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

????????只有resp3的檢驗結果為相同,其他都為不同,所以認為兩方法的各次重復測定均值向量有顯著差異


  • t.test()用法:

t.test(x,y=NULL,alternative=c("two.sided","less","greater"),mu=0,...)或

t.test(formula,data,...)

指定x未指定y時,進行單總體的t檢驗,可以指定mu檢驗其是否與mu相同

alternative指定雙邊檢驗或左尾檢驗或右尾檢驗

也可以用formula類的參數,即x~y的類型,y是分組變量,會對不同組的x進行雙總體t檢驗

  • wilcox.test()用法:

wilcox.test()用法與t.test()相同,此處不贅述

  • HotellingsT2()用法:

HotellingsT2(X,Y=NULL,mu=NULL,test="f",...)或

HotellingsT2(formula,...)

X與Y為矩陣或數據框,未指定Y時進行單總體的檢驗,可以指定mu檢驗其是否與mu相同

test參數指定近似統計量,默認為f,即F近似,可以指定"chi",即卡方近似

可以用formula類參數,與先前用法相同,但是HotellingsT2()沒有data參數

  • manova()用法:

manova(formula,data,...)

manova()的formula參數用法aov()類似,manova()返回的是多元方差分析的模型,將其賦給某個變量,然后用aov.summary()函數可以看每個變量的檢驗

2.3? 協差陣檢驗

? ? ? ? 在進行多元方差分析前需要進行協差陣齊性檢驗,協差陣檢驗可以用heplots包內的boxM()函數。

例2.3:

????????繼有無割草機家庭數據,檢驗兩組的協差陣是否有差異

> boxM(data4.1[,-3],group=data4.1[,3])Box's M-test for Homogeneity of Covariance Matricesdata:  data4.1[, -3]
Chi-Sq (approx.) = 0.99346, df = 3, p-value = 0.8028

? ? ? ? 檢驗結果為兩組協差陣相同

  • boxM()用法:

boxM(formula,data,...)或

boxM(Y,group,...)

formula類參數的用法與之前的函數相同

Y是數據矩陣或數據框,group是指定的分組變量

boxM()函數進行的是協差陣齊性檢驗,在分組變量的水平數大于2時也可以使用

三、小結

總結本文提到的函數和應用場景

參數估計正態性檢驗
函數應用場景函數應用場景
mean()計算一維變量的樣本均值shapiro.test()小樣本正態性檢驗
apply()對矩陣或數據框的行或列進行運算mshapiro.test()多元小樣本正態性檢驗
sapply()對矩陣或數據框的每個變量進行運算sapply()對每個變量進行指定運算或檢驗
summary()對數據框使用時返回每個變量的統計描述tapply()對以分組變量指定的不同組別分別進行指定的運算或檢驗
cov()獲取協方差或協差陣qqnorm()畫Q-Q圖
cor()獲取相關系數或相關陣qqline()在Q-Q圖中添加正態標準線
均值向量檢驗協差陣檢驗
函數應用場景函數應用場景
t.test()正態樣本的單雙總體均值檢驗boxM()協差陣齊性檢驗
wilcox.test()非正態樣本的單雙總體均值檢驗
HotellingsT2()多元正態樣本的單雙總體均值檢驗
aov()方差齊性情況下的方差分析
manova()協差陣齊性下的多元方差分析
aov.summary()獲取方差分析模型的檢驗結果

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/387390.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/387390.shtml
英文地址,請注明出處:http://en.pswp.cn/news/387390.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

30秒的PHP代碼片段-MATH

本文來自GitHub開源項目 點我跳轉 30秒的PHP代碼片段 精選的有用PHP片段集合,您可以在30秒或更短的時間內理解這些片段。數學函數 average 返回兩個或多個數字的平均值。 function average(...$items) { $count count($items); return $count 0 ? 0 : array_sum(…

Hive簡介

Hive最初是應Facebook每天產生的海量新興社會網絡數據進行管理和機器學習的需求而產生和發展的 是建立在Hadoop上的數據倉庫基礎架構 作為Hadoop的一個數據倉庫工具,Hive可以將結構化的數據文件映射為一張數據庫表,并提供簡單的SQL查詢功能 Hive作為數…

可用于 線性判別、聚類分析 的R語言函數總結

一、判別分析 判別分析是一種分類技術,其通過一個已知類別的“訓練樣本”來建立判別準則,并通過預測變量來為未知類別的數據進行分類。根據判別的模型分為線性判別和非線性判別,線性判別中根據判別準則又分為Fisher判別,Bayes判別…

Linux 環境下搭建 Jenkins(Hudson)平臺

安裝jenkins:安裝 jenkins 有兩種方式:安裝方式一: [java] view plaincopysudo java -jar jenkins.war –httpPort18080 –ajp13Port18009 但是很多時候我們是使用SSH方式到目標機器上的,放我們關閉SSH連接時,這個命…

Android APK 打包過程 MD

Markdown版本筆記我的GitHub首頁我的博客我的微信我的郵箱MyAndroidBlogsbaiqiantaobaiqiantaobqt20094baiqiantaosina.comAndroid APK 打包流程 MD 目錄 目錄APK 的打包流程整體流程資源的編譯和打包資源ID資源索引概況具體打包過程aapt階段aidl階段Java Compiler階段dex階段a…

可用于 主成分分析、R型因子分析、簡單相應分析 的R語言函數總結

一、主成分分析 主成分分析是多元統計分析的一種常用的降維方法,它以盡量少的信息損失,最大程度將變量個數減少,且彼此間互不相關。提取出來的新變量成為主成分,主成分是原始變量的線性組合。 1.1 KMO檢驗和Bartlett球形檢驗 在…

[國家集訓隊]墨墨的等式

Description 墨墨突然對等式很感興趣,他正在研究a1x1a2y2…anxnB存在非負整數解的條件,他要求你編寫一個程序,給定N、{an}、以及B的取值范圍,求出有多少B可以使等式存在非負整數解。 Input 輸入的第一行包含3個正整數,…

Storm簡介

Storm是實時流式數據處理框架,支持多種編程語言 應用案例: realtime analytics online machine learning continuous computation distributed RPC ETL 性能:a million tuples per second per node 可擴展、高容錯 結合消息隊列和數據庫…

持續集成之Jenkins安裝部署

安裝JDKJenkins是Java編寫的,所以需要先安裝JDK,這里采用yum安裝,如果對版本有需求,可以直接在Oracle官網下載JDK。 [rootlinux-node1 ~]# yum install -y java-1.8.0 安裝Jekins [rootlinux-node1 ~]# cd /etc/yum.repos.d/ […

2019/2/18 Python今日收獲

Python day15——032,033異常處理:你不可能總是對的 1. Python標準異常總結AssertionError斷言語句(assert)失敗AttributeError嘗試訪問未知的對象屬性EOFError用戶輸入文件末尾標志EOF(Ctrld)FloatingPoin…

Shell01

shell是一個命令解釋器,是操作系統的最外層。 把用戶的輸入解釋給操作系統,將操作系統的輸入結果返回給用戶。 硬件-->kernel-->shell-->外圍應用程序 shell腳本:將命令或語句寫入文件,進行操作系統管理。 shell腳本…

jenkins svn tomcat ant自動部署

Jenkins Jenkins是基于Java開發的一種持續集成工具,用于監控持續重復的工作,功能包括: 1、持續的軟件版本發布/測試項目。 2、監控外部調用執行的工作。 跟其他持續集成相比,它的主要優點有: 開源,即免…

Shell02

局部變量 1、普通字符串變量 變量名value 變量名value #單引號中不進行變量解析,原樣輸出,應用不多 變量名"value" #雙引號會解析變量 例: a1123 a2234 a3"345" echo "a1$a1" echo "a2$a2&quo…

553 mail from must equal authorized user解決方法

在配置發送郵件通知,驗證其正確性時,出現"553 mail from must equal authorized user"提示的錯誤; 原因在于沒有在"系統管理(Manage Jenkins)"的"系統設置(Configure system&…

3.1 讀入一個參數

已知正方形的邊長&#xff0c;求出其面積。 輸入樣例&#xff1a; 1 2 3 4 輸出樣例&#xff1a; 1 4 9 16 #include<iostream> #include<fstream> using namespace std;int main() {ifstream cin("test.txt");//向OJ提交時&#xff0c;注釋此句i…

[Apple開發者帳戶幫助]八、管理檔案(2)創建臨時配置文件(iOS,tvOS,watchOS)...

創建臨時配置文件以在設備上運行您的應用程序而無需Xcode。在開始之前&#xff0c;您需要一個App ID&#xff0c;一個分發證書和多個注冊設備。 有關完整的臨時配置文件工作流程&#xff0c;請轉到Xcode幫助中的分發到已注冊設備&#xff08;iOS&#xff0c;tvOS&#xff0c;wa…

Ant Build.xml

題記&#xff1a;用 Eclipse 3 &#xff0b;Tomcat 5 做東東&#xff0c;用起來還是比較爽。但是調試時每次手動Deploy到Tomcat中&#xff0c;比較麻煩。今用Ant來完成之。 1。打開Eclipse&#xff0c;在項目的根路徑下建立builds.xml文件。 這個是Ant配置的關鍵。其內容如下&…

3.2 讀入兩個參數

計算兩個整數的差。 輸入樣例&#xff1a; 1 3 5 7 輸出樣例&#xff1a; -2 -2 #include<iostream> #include<fstream> using namespace std;int main() {ifstream cin("test.txt");//向OJ提交時&#xff0c;注釋此句int num1, num2;while (cin &g…

解決做好一個機器學習項目的3個問題

機器學習是目前人工智能最令人激動的研究方向之一。我們可能更關注機器學習算法的實現細節&#xff0c;沉浸于機器學習所需要的數學功底&#xff0c;但對于機器學習從業者來說&#xff0c;如何更好更快速的實現一個機器學習項目更值得關注。 正如吳恩達在《機器學習》這門課中所…

數據挖掘的相關知識例子

一、貝葉斯 貝葉斯定理由英國數學家貝葉斯 ( Thomas Bayes 1702-1761 ) 發展&#xff0c;用來描述兩個條件概率之間的關系&#xff0c;比如 P(A|B) 和 P(B|A)。按照乘法法則&#xff0c;可以立刻導出&#xff1a;P(A∩B) P(A)*P(B|A)P(B)*P(A|B)。如上公式也可變形為&#xf…