【統計的思想】假設檢驗(一)

假設檢驗是統計學里的重要方法,同時也是一種“在理想與現實之間觀察求索”的測試活動。假設檢驗從概率的角度去考察理想與現實之間的關系,籍此來緩解測試可信性問題。

我們先來看一個例子。民航旅客服務系統,簡稱PSS系統,有一種業務叫換飛機,如果一個航班,原定執飛的飛機出了故障,就需要換飛機。但是可能換不到原來機型的飛機,比如原來是一個空客320,只能換到一個波音737,這就比較麻煩了,系統需要做很多事,要更換航班布局、所有旅客要重新安排座位,等等。用的時間會比較長。

假設PSS系統的一個期望是“換飛機的平均處理時長不超過160秒”。這是一個關于系統性能的期望。測試的時候,我們把換飛機的用例重復執行了6次,發現每次執行的系統處理時長都不一樣,平均值是170秒。

那么我們的測試結論應該是什么?能斷定系統性能不符合預期嗎?顯然不能,因為測試結果是一個隨機變量,我們只測了6次,如果再多測幾次,平均值可能就低于160秒了。

切比雪夫大數定律告訴我們,如果測試的次數足夠多,處理時長的算數平均值就會趨近于數學期望,也就是真正的“平均處理時長”。但是我們的資源是有限的,只夠我們做6次測試,所以結果一定有偏差,這就是抽樣誤差。而且,測試的次數越少,測試結果的方差越大,抽樣誤差也就越大。如果直接拿這樣的結果去下測試結論,一定是有偏頗的。這就是測試的五個基本問題之一——測試可信性問題的典型表現。

怎么辦呢?還是要依靠統計的思想。如果我們能知道,“6次測試的均值是170秒”,這樣一個結果發生的概率是多少,我們就能更準確地判斷,系統性能是不是符合預期,或者說,有多大可能符合預期,測試結論就能更靠譜一些。

那么,怎么才能知道170秒這個結果發生的概率是多少呢?這就是抽樣分布問題。抽樣分布研究的是:從總體中抽取的樣本,應該具有什么樣的統計特征,跟總體的統計特征有什么關系。這是統計學里的一個重要課題。

比方說,桶里面有4個球,重量分別是2/3/3/4公斤。總體的數學期望是3,方差是0.5,標準差是0.707。我們用放回抽樣的方式,從桶里抽2個球當樣本,也就是先抽一個,看看是多重的,放回桶里,再抽下一個。可能的抽樣結果一共有這樣16種:

每種結果出現的可能性是相同的,都是1/16。這樣我們就可以算出每種抽樣結果的樣本均值,以及所有16種樣本均值的數學期望和方差。可以看到,樣本均值的數學期望和總體的數學期望一樣,都是3;樣本均值的方差是0.25,也就是總體方差除以樣本量2。

如果增加樣本量,比如抽4個球,我們會發現結論是相同的,樣本均值的數學期望還是跟總體數學期望一樣;樣本均值的方差還是等于“總體方差除以樣本量”——看起來是有規律的。

接下來我們看樣本均值的概率分布。來算一下各種不同的樣本均值出現的概率,比如16種抽樣結果里,樣本均值是2.0的情況只出現了一次,所以2.0的概率是1/16;2.5出現了4次,所以2.5的概率是1/4。算出各個樣本均值的概率之后,就可以畫出樣本均值的概率分布曲線了:

看得出來,已經有點像正態分布了。如果樣本量是4,樣本均值的概率分布曲線是下面這個樣子,就更加接近正態分布:

從這個例子,我們可以引出抽樣分布的一組基本規律

  1. 樣本量越大,樣本均值越趨近于服從正態分布。

  2. 樣本均值的數學期望與總體的數學期望相同。

  3. 樣本均值的方差等于總體方差除以樣本量。

到這里,我們就完成了假設檢驗的理論儲備。那假設檢驗具體是怎么做的呢?我們還是用換飛機的例子來說明。

① 首先第一步是建立假設。我們先假設換飛機的平均處理時長是符合預期的,最多就是160秒。也就是說,總體均值是160。這個假設叫零假設。如果零假設成立,為什么實際測試結果均值會是170秒呢?因為這個170秒是“樣本均值”,跟“總體均值”之間有抽樣誤差。但是根據抽樣分布規律,樣本均值服從正態分布,有99.7%的概率會落在160附近6倍標準差的范圍內,所以這個誤差一般不會特別大,如果特別大就說明零假設有問題;

② 那怎么才算特別大呢?我們需要設定一個閾值,也叫顯著水平,意思是“理想和現實的差異是不是足夠顯著”,一般取一個比較小的值,比如0.05。如果一個抽樣誤差出現的概率比這個顯著水平還要低,那這個抽樣誤差就算“特別大”了,我們就可以認為,出現這種程度的誤差是一個小概率事件,在一次測試里面是不可能發生的。這就是小概率事件的實際不可能原理;

③ 第三步,在零假設的基礎上,計算測試結果的發生概率。我們做了6次性能測試,相當于抽取了6個樣本,樣本均值是170秒。按照抽樣分布規律,樣本均值近似服從正態分布,這個正態分布的數學期望跟總體一樣是160。另外假定總體方差已知,是144,那么樣本均值的方差就是144/6=24。因此,樣本均值的概率分布應該是:\bar{x}\sim N(\mu_{0},\frac{\sigma^{2}}{n})=N(160,24)

在這樣一個概率分布上,實際結果是170,也就是說,比均值160高出了10以上。這個結果的概率算下來是:P(T)=1-\Phi(\frac{170-60}{\sqrt{24}} )=0.0207

④ 最后,把這個概率跟顯著水平0.05作比較,發現比顯著水平要小,說明測試結果是一個小概率事件,但是的的確確發生了。也就是說,從零假設出發推出了矛盾,當然這個矛盾是統計意義上的矛盾。這時候,我們就可以否定零假設,所以最終的測試結論是,在顯著水平0.05的意義上,換飛機的平均處理時長不符合預期,超過了160秒。

把假設檢驗的過程總結成一句話,就是:首先假設理想和現實相符,然后根據抽樣分布規律,計算測試結果出現的概率,如果概率比顯著水平低,就否定零假設,如果概率比顯著水平高,就接受零假設。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/66376.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/66376.shtml
英文地址,請注明出處:http://en.pswp.cn/web/66376.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SpringBoot2 + Flowable(UI)

文章目錄 引言I 技術棧軟件架構基于 Vue.js 和 Element UI 的后臺管理系統工程結構II 依賴rest,logic,conf 的依賴工作流flowable jar包flowable-ui所需jar包III 配置jdbc 配置 nullCatalogMeansCurrent = true引言 I 技術棧 軟件架構 前端基于vue 、element-ui框架分模塊設…

Linux探秘坊-------3.開發工具詳解(1)

1 初識vim編輯器 創建第一個vim編輯的代碼 1.新建文件 2.使用vim打開 3.打開默認是命令模式,寫代碼需要在屏幕上輸出“i”字符 1.寫完代碼后要按Esc鍵退出到指令模式2.再按shift:wq即可保存并退出vim (因為不支持鼠標,通常 使用鍵盤上的箭…

基于海思soc的智能產品開發(高、中、低soc、以及和fpga的搭配)

【 聲明:版權所有,歡迎轉載,請勿用于商業用途。 聯系信箱:feixiaoxing 163.com】 市場上關于圖像、音頻的soc其實非常多,這里面有高、中、低檔,開發方式也不相同。之所以會這樣,有價格的因素&am…

51單片機——DS18B20溫度傳感器

由于DS18B20數字溫度傳感器是單總線接口,所以需要使用51單片機的一個IO口模擬單總線時序與DS18B20通信,將檢測的環境溫度讀取出來 1、DS18B20模塊電路 傳感器接口的單總線管腳接至單片機P3.7IO口上 2、DS18B20介紹 2.1 DS18B20外觀實物圖 管腳1為GN…

STL容器-- list的模擬實現(附源碼)

STL容器-- list的模擬實現(附源碼) List的實現主要時考察我們對list這一容器的理解,和代碼的編寫能力,通過上節對list容器的使用,我們對list容器已經有了一些基本的了解,接下來就讓我們來實現一些list容器常…

Redis 學習指南與資料分享

Redis學習資料 Redis學習資料 Redis學習資料 Redis 作為一款高性能內存數據庫,在當今軟件開發領域占據著重要地位。其豐富的數據類型、強大的功能特性以及廣泛的應用場景,吸引著眾多開發者深入學習。以下為你精心整理的 Redis 學習指南與實用資料分享&…

Lynx TiDB 慢日志收集工具

作者: 小龍蝦愛大龍蝦 原文來源: https://tidb.net/blog/7247e68f 簡介 lynx 工具可以定時將 TiDB 集群的慢查詢收集并持久化到后端數據庫中,然后通過 grafana 查詢展示出來,這可以幫助我們更好的分析慢查詢日志。 背景 盡管…

Gin 源碼概覽 - 路由

本文基于gin 1.1 源碼解讀 https://github.com/gin-gonic/gin/archive/refs/tags/v1.1.zip 1. 注冊路由 我們先來看一段gin代碼,來看看最終得到的一顆路由樹長啥樣 func TestGinDocExp(t *testing.T) {engine : gin.Default()engine.GET("/api/user", f…

docker 基礎語法學習,K8s基礎語法學習,零基礎學習

下面是關于Docker和Kubernetes的基礎語法學習資料,包括一些關鍵概念和示例代碼。 Docker 基礎語法 1. 安裝 Docker 首先,你需要安裝 Docker。以下是不同操作系統上的安裝指南: Windows/Mac: 下載并安裝 Docker Desktop。 Linux: 根據你的…

【逆境中綻放:萬字回顧2024我在挑戰中突破自我】

🌈個人主頁: Aileen_0v0 🔥熱門專欄: 華為鴻蒙系統學習|計算機網絡|數據結構與算法 ?💫個人格言:“沒有羅馬,那就自己創造羅馬~” 文章目錄 一、引言二、個人成長與盤點情感與心理成長學習與技能提升其它榮譽 三、年度創作歷程回顧創作內容概…

職場溝通與行為

職場溝通與行為 引言 在職場上,你是否曾遇到過困惑的溝通?是否對同事的行為有過疑慮?這不僅是個別現象,而是我們這個時代工作文化中的普遍問題。許多職場的摩擦,來自溝通不暢或是行為不當。那么,如何才能…

【Linux 重裝】Ubuntu 啟動盤 U盤無法被識別,如何處理?

背景 U盤燒錄了 Ubuntu 系統作為啟動盤,再次插入電腦后無法被識別 解決方案(Mac 適用) (1)查找 USB,(2)格式化(1)在 terminal 中通過 diskutil list 查看是…

中職網絡建設與運維ansible服務

ansible服務 填寫hosts指定主機范圍和控制節點后創建一個腳本,可以利用簡化腳本 1. 在linux1上安裝系統自帶的ansible-core,作為ansible控制節點,linux2-linux7作為ansible的受控節點 Linux1 Linux1-7 Yum install ansible-core -y Vi /etc/ansible/hosts 添加…

數據庫服務體系結構

1. 數據庫服務應用配置 服務進行配置有什么作用? 實現服務運行啟動 實現某些功能 應用配置有三種方式? 利用編譯安裝進行配置 編寫配置文件信息 ,.默認的配置文件: /etc/my.cnf 利用啟動命令參數配置信息,mysqld_safe --skip-grant-tables --…

Langchain+FastApi+Vue前后端Ai對話(超詳細)

一、引入 首先可以先看下作者的文章 FastApi相關文章:創建最簡單FastApi的項目Vue相關文章:最簡單的aixos二次封裝Langchain相關文章:如何使用LangSmith跟蹤deepseek模型 二、后端搭建 1 項目文件結構 routers:存放api接口se…

如何在不暴露MinIO地址的情況下,用Spring Boot與KKFileView實現文件預覽

在現代Web應用中,文件預覽是一項常見且重要的功能。它允許用戶在不上傳或下載文件的情況下,直接在瀏覽器中查看文件內容。然而,直接將文件存儲服務(如MinIO)暴露給前端可能會帶來安全風險。本文將介紹如何在不暴露MinI…

簡歷_使用優化的Redis自增ID策略生成分布式環境下全局唯一ID,用于用戶上傳數據的命名以及多種ID的生成

系列博客目錄 文章目錄 系列博客目錄WhyRedis自增ID策略 Why 我們需要設置全局唯一ID。原因:當用戶搶購時,就會生成訂單并保存到tb_voucher_order這張表中,而訂單表如果使用數據庫自增ID就存在一些問題。 問題:id的規律性太明顯、…

Jira中bug的流轉流程

Jira中bug的狀態 1. 處理Bug的流程2. bug狀態流轉詳述bug的狀態通常包括 1. 處理Bug的流程 2. bug狀態流轉詳述 bug的狀態通常包括 未解決 1. 測試人員創建一個bug,填寫bug的詳細信息,如概要、bug級別、復現步驟、現狀、預期結果等 2. 定位bug&#x…

Linux的幾個基本指令

文章目錄 一、幾個基本指令1、ls 指令注意! 2、pwd命令3、touch 指令4、mkdir 指令注意!注意! 5、cd 指令注意! 6、cp 指令 今天我們學習Linux下的幾個基本指令,本篇是在Xshell環境下執行的。 一、幾個基本指令 1、…

軟件工程師歐以寧:引領無人機導航與物聯網安全的技術革新

在科技日新月異的今天,軟件工程師歐以寧憑借卓越的技術能力和前瞻性的創新思維,成為了無人機自主導航和物聯網安全領域的佼佼者。作為一名深耕技術前沿的專家,歐以寧不僅推動了無人機導航技術的突破性進展,還為智能家居和物聯網的安全架構提供了全新的解決方案。她的研究成果,以…