做數據分析為何要學統計學(5)——什么問題適合使用t檢驗?

t檢驗(Student's t test),主要依靠總體正態分布的小樣本(例如n < 30)對總體均值水平進行差異性判斷。

t檢驗要求樣本不能超過兩組,且每組樣本總體服從正態分布(對于三組以上樣本的,要用方差分析,其他文章詳述)。因此使用t檢驗前需要對所有樣本分別進行正態分布檢驗。如果有不服從正態分布的情況,可以考慮使用MannWhitney檢驗Wilcoxon檢驗,后面單獨文章介紹。

需要說明的是t檢驗還分為單樣本t檢驗、獨立雙樣本t檢驗配對雙樣本t檢驗,適用條件也各有不同,以下分別舉例介紹。

1.單樣本t檢驗

用于判斷總體是否與既定均值無差異,可以通俗理解為總體均值是否與該既定均值相等。如下例

某產品合格率經10輪檢測,保持在如下水平,試問可否認為其合格率為96.5%?

合格率(%):97.6 93.5 98.7 95.4 95.2 97.7 96.1 94.6 96.8 95.7

首先,使用scipy.stats.normaltest對樣本進行正態分布檢驗.

from scipy import stats
import numpy as np
X=np.array([97.6,93.5, 98.7 ,95.4 ,95.2 ,97.7, 96.1 ,94.6 ,96.8 ,95.7])
stats.normaltest(X)
結果:NormaltestResult(statistic=0.07878377023988445, pvalue=0.9613738871946388)。p>0.05,樣本通過正態分布檢驗。

然后,使用sstats.ttest_1samp進行單樣本t檢驗。

stats.ttest_1samp(X,96.5)

結果:Ttest_1sampResult(statistic=-0.7396549082121191, pvalue=0.47835758603283807)。p>0.05,接受總體均值為96.5%的假設。

2.獨立雙樣本t檢驗

用于判斷兩組獨立樣本在總體上是否均值無差異,可以通俗理解為兩組獨立采樣的樣本所代表的總體均值是否相等。所謂獨立采樣指的是:對不同個體或單位的受試對象進行采樣,如對男性和女性的身高進行采樣。采樣方法可以相同,也可以不同。

獨立雙樣本t檢驗還要求兩組樣本的總體方差齊性(也就是無差異),如果方差不齊,則可以使用Welch t檢驗(Welch's t-test)。

首先我們先來看滿足獨立雙樣本t檢驗的例子。

某產品兩條生產線的合格率經10輪檢測,保持在如下水平,試問可否認為其合格率是相同的?

生產線1合格率(%):97.6 93.5 98.7 95.4 95.2 97.7 96.1 94.6 96.8 95.7

生產線2合格率(%):97.2 94.2?97.8?94.9?96.3?98.7 96.5?95.6 97.1?96.2

以下為示例代碼

X1=np.array([97.6,93.5, 98.7 ,95.4 ,95.2 ,97.7, 96.1 ,94.6 ,96.8 ,95.7])
X2=np.array([97.2,94.2,97.8,94.9,96.3,98.7,96.5,95.6,97.1,96.2])
#正態分布檢驗
stats.normaltest(X1),stats.normaltest(X2)
#方差齊性檢驗
stats.levene(X1,X2)
#獨立雙樣本t檢驗
stats.ttest_ind(X1,X2)

上述各項檢驗p值均大于0.05,因此可以接受兩條生產線產品質量無差異的假設。

如果X2=[87.2,92.2,97.8,97.9,96.3,98.7,86.5,95.6,97.1,86.2],則兩組樣本無法通過方差齊性檢驗(p=0.03878,小于顯著性水平a=0.05)。于是,我們采用Welch t檢驗。

#獨立雙樣本Welch t檢驗,equal_var參數值為False時,ttest_ind執行Welch t檢驗檢驗
stats.ttest_ind(X1,X2,equal_var=False)

檢驗結果為:Ttest_indResult(statistic=1.5289576830456144, pvalue=0.15523450660981364)。可以接受兩個生產線產品質量相同的假設。

3.配對雙樣本t檢驗

用于判斷兩組配對樣本在總體上是否均值無差異。所謂配對采樣指的是:對同一個體或單位的受試對象進行采樣,如一個人在兩個不同時間點的血壓值。

配對雙樣本t檢驗也要求兩組樣本的總體方差齊性,同時要求樣本容量相同且兩個樣本各數值的順序與采樣順序一致。

配對雙樣本t檢驗的函數是stats.ttest_rel(X1,X2),使用方法與獨立雙樣本t檢驗相同,不再贅述。


以上介紹的是均值無差異推斷。這種推斷是雙側的(two-sided),在實際應用中,我們還會遇到單側檢驗(one-sided)的情況,即判斷不同總體的均值大小。例如判斷第一條生產線的產品質量是否優于第二條生產線。

無論是獨立雙樣本t檢驗還是配對雙樣本t檢驗均支持單側檢驗,只需要在檢驗函數中加入alternative參數即可。該參數的取值為“less”或"greater"。如下例

#X1與X2服從正態分布但方差不齊,使用Welch t檢驗(單側)
X1=np.array([97.6,93.5, 98.7 ,95.4 ,95.2 ,97.7, 96.1 ,94.6 ,96.8 ,95.7])
X2=np.array([87.2,92.2,97.8,97.9,96.3,98.7,86.5,95.6,93.1,86.2])
stats.ttest_ind(X1,X2,alternative="less",equal_var=False)
結果:Ttest_indResult(statistic=1.81631548017011, pvalue=0.9514575126271494)。

該結果如何解讀呢?是\bar{X_1}>\bar{X_2},還是\bar{X_1}<\bar{X_2}?這是很多初學者比較困惑的地方。這里作出重要解釋:

假設檢驗的基本思想是“小概率事件”原理,其統計推斷方法是帶有某種概率性質的反證法。換句話說,我想得到A這個結果,我需要做得事是證明\bar{A}不成立。也就是說

零假設(null hypothesis,無效假設)H_0: \bar{A}

備擇假設(alternative hypothesis,想要的結果)H_1: A

?上述檢驗的備擇檢驗H1是"less",所以零假設H0就是"greater"。由于p>0.05,所以接受零假設,即\bar{X_1}>\bar{X_2}

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/208584.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/208584.shtml
英文地址,請注明出處:http://en.pswp.cn/news/208584.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

同一個kmz數據同樣的底圖在QGIS上顯示位置正常, 在Mars3d中顯示就偏移了一些

問題&#xff1a; 1.同一個kmz數據同樣的底圖在QGIS上顯示位置正常, 在網頁中顯示就偏移了一些 在qgis上的顯示效果&#xff0c;和在mars3d的顯示效果&#xff1a;數據明顯存在偏移。 解決步驟&#xff1a; 1.查看了kmz數據&#xff0c;里面實際是tif圖片數據&#xff0c;估…

MES管理系統在非標制造企業中的應用

在當今制造業中&#xff0c;非標制造企業逐漸成為一種重要的存在。與傳統的批量生產制造企業不同&#xff0c;非標制造企業主要特點是能夠根據客戶需求進行定制化生產。這種定制化的生產模式對企業的管理提出了更高的要求&#xff0c;同時也帶來了更多的挑戰。在非標制造企業中…

mac蘋果電腦清除數據軟件CleanMyMac X4.16

在數字時代&#xff0c;保護個人隱私變得越來越重要。當我們出售個人使用的電腦&#xff0c;亦或者離職后需要上交電腦&#xff0c;都需要對存留在電腦的個人信息做徹底的清除。隨著越來越多的人選擇使用蘋果電腦&#xff0c;很多人想要了解蘋果電腦清除數據要怎樣做才是最徹底…

ELK(三)—安裝可視化工具

目錄復制 目錄 一、ElasticSearch-Head可視化工具介紹1.1特性&#xff1a;1.2用法&#xff1a; 二、安裝2.1docker安裝2.2Chrome插件安裝 一、ElasticSearch-Head可視化工具介紹 ElasticSearch-Head 是一個基于瀏覽器的 Elasticsearch 可視化工具&#xff0c;它提供了一個直觀…

【GAMES101】觀測變換

圖形學不等于 OpenGL&#xff0c;不等于光線追蹤&#xff0c;而是一套生成整個虛擬世界的方法 記得有個概念叫光柵化&#xff0c;就是把三維虛擬世界的事物顯示在二維的屏幕上&#xff0c;這里就涉及到觀察變換 觀察變換&#xff0c;叫viewing transformation&#xff0c;包括…

1、關于前端js-ajax繞過

1、Ajax知識 、js--Ajax 傳統請求跟js--Ajax請求的差別 在實例中用的上js-ajax的有 表單驗證&#xff1a; 在用戶填寫表單時&#xff0c;可以使用 Ajax 在不刷新頁面的情況下驗證表單字段&#xff0c;并提供即時反饋。 實時搜索&#xff1a; 在搜索框中輸入內容時&#xff0…

Gateway

網關的作用&#xff1a; 可以對訪問的用戶進行身份認證和權限校驗還可以服務路由&#xff0c;負載均衡還可以進行請求限流 網關本身也是微服務的一部分&#xff0c;所以需要使用nacos進行服務注冊和發現 網關路由的配置 路由id&#xff1a;路由唯一標識uri&#xff1a;路由…

使用STM32 HAL庫進行GPIO控制的實例

?作者簡介&#xff1a;熱愛科研的嵌入式開發者&#xff0c;修心和技術同步精進&#xff0c; 代碼獲取、問題探討及文章轉載可私信。 ? 愿你的生命中有夠多的云翳,來造就一個美麗的黃昏。 &#x1f34e;獲取更多嵌入式資料可點擊鏈接進群領取&#xff0c;謝謝支持&#xff01;…

獨立服務器的主要應用方向有什么_Maizyun

獨立服務器的主要應用方向有什么&#xff1f; 獨立服務器是指托管單一應用程序或網站的單臺服務器。隨著互聯網的發展&#xff0c;獨立服務器已經成為許多企業和個人用戶的重要選擇&#xff0c;因為它提供了更高的靈活性和控制權。本文將探討獨立服務器的主要應用方向。 一、…

利用R語言heatmap.2函數進行聚類并畫熱圖

數據聚類然后展示聚類熱圖是生物信息中組學數據分析的常用方法&#xff0c;在R語言中有很多函數可以實現&#xff0c;譬如heatmap,kmeans等&#xff0c;除此外還有一個用得比較多的就是heatmap.2。最近在網上看到一個筆記文章關于《一步一步學heatmap.2函數》&#xff0c;在此與…

計算機存儲結構分析(寄存器,內存,緩存,硬盤)

https://blog.csdn.net/bemodesty/article/details/81476906 前言 一個計算機包含多種存儲器比如&#xff1a;寄存器、高速緩存、內存、硬盤、光盤等&#xff0c;為啥有這么多種存儲方式&#xff0c;對于不太了解的人&#xff0c;總是覺得云里霧里的&#xff0c;搞不明白原因…

java-兩個列表進行比較,判斷那些是需要新增的、刪除的、和更新的

文章目錄 前言兩個列表進行比較&#xff0c;判斷那些是需要新增的、刪除的、和更新的 前言 如果您覺得有用的話&#xff0c;記得給博主點個贊&#xff0c;評論&#xff0c;收藏一鍵三連啊&#xff0c;寫作不易啊^ _ ^。 ??而且聽說點贊的人每天的運氣都不會太差&#xff0c;實…

SpringIOC之@Configuration

博主介紹&#xff1a;?全網粉絲5W&#xff0c;全棧開發工程師&#xff0c;從事多年軟件開發&#xff0c;在大廠呆過。持有軟件中級、六級等證書。可提供微服務項目搭建與畢業項目實戰&#xff0c;博主也曾寫過優秀論文&#xff0c;查重率極低&#xff0c;在這方面有豐富的經驗…

Django的logging-日志模塊的簡單使用方法

擴展閱讀&#xff1a; Python-Django的“日志功能-日志模塊(logging模塊)-日志輸出”的功能詳解 現在有下面的Python代碼&#xff1a; # -*- coding: utf-8 -*-def log_out_test(content_out):print(content_out)content1 "i love you01" log_out_test(content1)現…

云服務器Centos中安裝Docker

云服務器Centos中安裝Docker 1 簡介DockerCentosCentos和Ubuntu區別 2 安裝3 測試hello-world的鏡像測試 1 簡介 Docker Docker是一個開源的應用容器引擎&#xff0c;利用操作系統本身已有的機制和特性&#xff0c;可以實現遠超傳統虛擬機的輕量級虛擬化。它支持將軟件編譯成…

Hive 淺析

Hive是一個簡單的LUA沙盒&#xff0c;除了基本的LUA解釋器的功能以外&#xff0c;還提供了諸如熱加載等功能。 了解HIVE的工作原理有利于了解Lua虛擬機的底層實現機理。 本文從是什么-怎么用-為什么三個維度介紹HIVE。 Hive Hive是什么 hive是一個簡單的LUA應用框架,目前基于…

Mybatis Plus詳解【一】

一、簡介 MybatisPlus可以節省大量時間&#xff0c;所有的CRUD代碼都可以自動化完成。MyBatis-Plus是一個MyBatis的增強工具&#xff0c;在 MyBatis 的基礎上只做增強不做改變&#xff0c;為簡化開發、提高效率而生。 特性&#xff1a; 無侵入&#xff1a;只做增強不做改變&…

Windows 12 和 AI 計算機

據商業時報消息 &#xff0c;微軟計劃于 2024 年 6 月發布Windows 12。 新版本的操作系統將伴隨集成人工智能。 該數據基于廣達首席執行官林百里和宏基陳杰森在中國臺北醫療科技展上的發言。 雖然這篇文章沒有直接引用微軟高管的話&#xff0c;但它是根據他們的評論得出的結…

IDEA 社區版 add GitLab Account

問題 IntelliJ IDEA Community Edition 2023.3&#xff08;社區版&#xff09;在使用GitLab連接時&#xff0c;使用個人訪問令牌出現報錯&#xff0c;代碼&#xff1a; GraphQL error:[No such type ProjectMember,so it cant be a fraggment condition,Field id doesnt exis…

2023年最新prometheus + grafana搭建和使用

一、安裝prometheus 1.1 安裝 prometheus官網下載地址 sudo -i mkdir -p /opt/prometheus #移動解壓后的文件名到/opt/,并改名prometheus mv prometheus-2.45 /opt/prometheus/ #創建一個專門的prometheus用戶&#xff1a; -M 不創建家目錄&#xff0c; -s 不讓登錄 useradd…