如何理解泊松分布

文章目錄

    • 一、引例——鯨魚研究
    • 二、泊松分布


一、引例——鯨魚研究

有生態學家對生活在北冰洋水域的鯨魚進行了跟蹤研究,他們利用一臺水下無人機來探測鯨魚數量,這是近十天的數據:

第1天第2天第3天第4天第5天第6天第7天第8天第9天第10天
1010141211158976

最后四天鯨魚數目的連續減少趨勢令人擔憂,水質惡化嗎?。

注意到每天探測到的鯨魚不會是同時發生的,而是分散在一天的不同時間段。

這事實上是一個隨機事件的時間分布,于是我們將一天時間劃分為12段,那么第一天的數據如下:

外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳

那么對于這組數據,鯨魚出現的概率 p = 5/6

我們試圖把魚群數量轉換成時間上的二項分布,那么 12 個 時間段就轉化成了一個二項分布,一天內出現10頭鯨魚的概率如下:
Cnk?pk?(1?p)n?k=C1210?(56)10?(16)2=0.2961C_n^k \cdot p^k \cdot (1-p)^{n-k} = C_{12}^{10} \cdot (\frac{5}{6})^{10} \cdot (\frac{1}{6})^2 = 0.2961 Cnk??pk?(1?p)n?k=C1210??(65?)10?(61?)2=0.2961
這正是 拉普拉斯 得意門生 西莫恩·德尼·泊松(1781~1840) 的思路。

前面我們選取的是第一天的數據,我們現在選取第二天的數據,有14頭鯨魚,12個時間段有些不夠用,于是我們劃分成24個時間段。

外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳

則一天中出現14頭鯨魚的概率:
pi=1424=712則Cnk?pk?(1?p)n?k=C2414?(712)14?(512)10=0.1634\begin{align} & p_i = \frac{14}{24} = \frac{7}{12} & 則 C_n^k \cdot p^k \cdot (1-p)^{n-k} = C_{24}^{14} \cdot (\frac{7}{12})^{14} \cdot (\frac{5}{12})^{10} = 0.1634 \end{align} ?pi?=2414?=127??Cnk??pk?(1?p)n?k=C2414??(127?)14?(125?)10=0.1634??
但是我們上面的思考有一個漏洞就:一個時間段是有可能有多頭鯨魚出現的

這說明什么?時間段太大了!我們直接把一天劃分成無數個時間段,單獨每個時間段都趨于無窮小,這樣無論兩頭鯨魚的時間挨得有多近,都能區分開來,則有:
limn→∞Cnk?pk?(1?p)n?k,其中:n代表時間分段數,p代表任意時間段內鯨魚出現的概率p的估計不再以某一天數據為準,而是選取平均值,即p=μn\begin{align} & lim_{n \rightarrow \infty} C_n^k \cdot p^k \cdot (1-p)^{n-k},其中:\\ & n代表時間分段數,p代表任意時間段內鯨魚出現的概率 \\ & p的估計不再以某一天數據為準,而是選取平均值,即 p = \frac{\mu}{n} \end{align} ?limn?Cnk??pk?(1?p)n?k,其中:n代表時間分段數,p代表任意時間段內鯨魚出現的概率p的估計不再以某一天數據為準,而是選取平均值,即p=nμ???

公式的進一步推導
limn→∞Cnk?pk?(1?p)n?k=limn→∞Cnk?(μn)k?(1?μn)n?k=lim?n→∞n(n?1)(n?2)?(n?k+1)k!?μknk?(1?μn)n?k=μkk!?lim?n→∞n(n?1)(n?2)?(n?k+1)nk?(1?μn)n?k=μkk!?lim?n→∞nn(n?1)n(n?2)n?(n?k+1)n?(1?μn)n?k=μkk!?lim?n→∞1?1…1?(1?μn)n?k=μkk!?lim?n→∞(1?μn)n?k=μkk!?lim?n→∞(1?μn)n?lim?n→∞(1?μn)?k=μkk!?lim?n→∞(1?μn)n=μkk!e?μ(等價無窮小)\begin{align} & lim_{n \rightarrow \infty} C_n^k \cdot p^k \cdot (1-p)^{n-k} \\ =& lim_{n \rightarrow \infty} C_n^k \cdot (\frac{\mu}{n})^k \cdot (1-\frac{\mu}{n})^{n-k} \\ =& \lim _{n \rightarrow \infty} \frac{n(n-1)(n-2) \cdots(n-k+1)}{k!} \cdot \frac{\mu^{k}}{n^{k}} \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \frac{n(n-1)(n-2) \cdots(n-k+1)}{n^{k}} \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \frac{n}{n} \frac{(n-1)}{n} \frac{(n-2)}{n} \cdots \frac{(n-k+1)}{n} \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} 1 \cdot 1 \dots 1 \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{n} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{n} \\ =& \frac{\mu^{k}}{k!} e^{-\mu} (等價無窮小) \\ \end{align} =========?limn?Cnk??pk?(1?p)n?klimn?Cnk??(nμ?)k?(1?nμ?)n?knlim?k!n(n?1)(n?2)?(n?k+1)??nkμk??(1?nμ?)n?kk!μk??nlim?nkn(n?1)(n?2)?(n?k+1)??(1?nμ?)n?kk!μk??nlim?nn?n(n?1)?n(n?2)??n(n?k+1)??(1?nμ?)n?kk!μk??nlim?1?11?(1?nμ?)n?kk!μk??nlim?(1?nμ?)n?kk!μk??nlim?(1?nμ?)n?nlim?(1?nμ?)?kk!μk??nlim?(1?nμ?)nk!μk?e?μ(等價無窮小)??

二、泊松分布

我們把上面的μ 換成 λ,就得到了我們熟悉的泊松分布公式:
λkk!e?λ,其中λ代表給定時間段或空間區域內,隨機事件平均發生的次數。\frac{\lambda^k}{k!}e^{-\lambda},其中 \lambda 代表給定時間段或空間區域內,隨機事件平均發生的次數。 k!λk?e?λ,其中λ代表給定時間段或空間區域內,隨機事件平均發生的次數。

我們利用該公式計算引例中各時間段鯨魚出現數目的可能性,并用柱狀圖來表示:

外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳

我們取顯著性水平為 6.5%,那么從圖中可以得知,鯨魚數目在[5, 15]都是正常范圍,我們的樣本都在正常范圍內。

有時候我們會用用泊松分布近似二項分布,一般在 試驗次數n 很大,成功概率 p 很小,且 λ = np 為有限值時,二項分布可以用泊松分布來近似,經過前面的推導,不難明白其中緣由。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/92835.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/92835.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/92835.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python學習DAY22打卡

作業: 自行學習參考如何使用kaggle平臺,寫下使用注意點,并對下述比賽提交代碼 kaggle泰坦尼克號人員生還預測 import warnings warnings.filterwarnings("ignore") #忽略警告信息 # 數據處理清洗包 import pandas as pd import …

在 Ansys CFX Pre 中配置 RGP 表的分步指南

掌握在 Ansys CFX Pre 中設置 RGP 表的技巧,以優化仿真精度和效率。挑戰在計算流體動力學 (CFD) 領域,RGP(真實氣體屬性)表對于準確模擬流體在不同條件下的行為至關重要。這些表格提供了詳細的熱力學屬性&a…

C語言————原碼 補碼 反碼 (日漸清晰版)

本文的內容通下面這篇文章有著緊密的聯系,讀者可以選擇性閱讀 C語言————二、八、十、十六進制的相互轉換-CSDN博客 目錄 基本概念 原碼 反碼 補碼 轉換 數據的存儲方式 基本存儲單位 數據的計算方式 補碼的模運算原理 移位操作符 左移操作符 右移操…

函數-變量的作用域和生命周期

變量的作用域 引入問題 我們在函數設計的過程中,經常要考慮對于參數的設計,換句話說,我們需要考慮函數需要幾個參數,需要什么類型的參數,但我們并沒有考慮函數是否需要提供參數,如果說函數可以訪問到已定義…

Ansible在配置管理中的應用

Ansible是一個開源的配置管理和應用程序部署工具,它使用YAML語言編寫的Playbook來描述配置和應用部署過程。通過SSH協議與目標機器通信,Ansible可以實現批量操作,極大地提升了工作效率。核心功能Ansible的核心功能包括:配置管理&a…

【學習路線】Go語言云原生開發之路:從簡潔語法到微服務架構

一、Go語言基礎入門(1-2個月) (一)環境搭建與工具鏈Go環境安裝 官方安裝:從golang.org下載安裝包版本管理:g、gvm等Go版本管理工具環境變量:GOROOT、GOPATH、GOPROXY配置Go Modules:…

軟件工廠:推動新質生產力的組織躍遷

引言:軟件工廠的建設,不在于工具多,而在于理解深;不在于上線快,而在于體系穩。不僅是“看得見的流水線”,更是“看不見的組織變革”。在新質生產力的時代命題下,軟件工廠正成為連接創新與效率、…

9.0% 年增速驅動!全球自清潔滾輪拖布機器人市場2031年將邁向 946 百萬美元

自清潔滾輪拖布機器人是重要的智能清潔設備,采用滾筒式拖布結構,集掃拖功能,通過高速旋轉加壓擦洗地面,深度除污。其活水清潔系統可實時自清潔、回收污水,避免二次污染,提升清潔效率與效果,帶來…

新能源工廠的可視化碳中和實驗:碳足跡追蹤看板與能源調度策略仿真

摘要新能源工廠明明用著風電、光伏等清潔能源,碳排放數據卻依舊居高不下?某鋰電池廠耗費百萬升級設備,碳足跡卻難以精準追蹤,能源調度全靠經驗“拍腦袋”,導致成本飆升。而隔壁企業通過可視化碳中和實驗,碳…

數據結構自學Day13 -- 快速排序--“非遞歸利用棧實現”

一、快速排序回顧 快速排序本質上是**“分而治之”(Divide and Conquer)策略的遞歸應用。但遞歸其實就是函數棧的一種體現,因此我們也可以顯式使用棧(stack)來模擬遞歸過程**,從而實現非遞歸版本的快速排序…

前端數據庫:IndexedDB 基礎使用

前言 在現代 Web 開發中,隨著應用程序復雜度的增加,對本地存儲的需求也越來越高。雖然 localStorage 和 sessionStorage 可以滿足一些簡單的數據存儲需求,但當需要存儲大量結構化數據或進行復雜查詢時,它們就顯得力不從心了。這時…

Kubernetes深度解析:企業級容器編排平臺的核心實踐

引言:Kubernetes的戰略地位與核心價值在云原生技術生態中,??Kubernetes??已成為容器編排的事實標準。根據2023年全球云原生調查報告:全球??96%?? 的組織正在使用或評估Kubernetes企業生產環境Kubernetes采用率增長??400%??&#…

Netty中future和promise用法和區別

定義與概念 Future:表示一個異步操作的結果。它是只讀的,意味著你只能查看操作是否完成、是否成功、獲取結果或者異常等信息,但不能主動設置操作的結果。Promise:是 Future 的可寫擴展。它不僅可以像 Future 一樣查看操作結果&…

微算法科技(NASDAQ:MLGO)采用分布式哈希表優化區塊鏈索引結構,提高區塊鏈檢索效率

隨著區塊鏈技術的快速發展,其在各個領域的應用越來越廣泛。然而,區塊鏈數據的存儲和檢索效率問題一直是制約其發展的瓶頸之一。為了解決這一問題,微算法科技(NASDAQ:MLGO)采用了分布式哈希表(DHT)技術來優化…

Jmeter的元件使用介紹:(三)配置元件詳解01

Jmeter的配置元件有非常多,常用的有:信息頭管理器、Cookie管理器、用戶定義的變量、Http請求默認值、JDBC Connection Configuration、CSV 數據文件設置、計數器等,本文會對這些常用的配置元件一一介紹,還有其他很多配置元件&…

git 連接GitHub倉庫

一、安裝 git 包在官網下載 git 包二、通過SSH密鑰與GitHub遠程倉庫連接1. 檢查本地 SSH 密鑰是否存在ls -al ~/.ssh如果看到 id_rsa 和 id_rsa.pub,說明已有密鑰。2.如果沒有,生成新的 SSH 密鑰:ssh-keygen -t ed25519 -C "your_email…

如何通過AI掃描代碼中的問題

代碼質量其實在需求高壓,業務快速迭代的場景下往往容易被人忽視的問題,大家的編碼習慣和規范也經常會各有喜好,短期之內獲取看不出來什么問題,但長此以往就會發現,屎山逐步成型了,而線上代碼跑著往往就不想…

Java 大視界 -- Java 大數據機器學習模型在金融衍生品市場波動特征挖掘與交易策略創新中的應用(363)

Java 大視界 -- Java 大數據機器學習模型在金融衍生品市場波動特征挖掘與交易策略創新中的應用(363)引言:正文:一、Java 構建的金融數據處理架構1.1 多源異構數據實時融合1.2 新聞輿情與市場沖擊建模二、Java 驅動的波動特征挖掘與…

Cartographer安裝測試與模塊開發(三)--Cartographer在Gazebo仿真環境下的建圖以及建圖與定位階段問題(實車也可參考)

參數介紹之所以要首先介紹參數而不是實操,是因為大部分建圖失敗、漂移基本上都是參數設置錯誤引起的,或者說大部分都是TF存在問題,主要是坐標系Frame之間有沖突或者對不上等原因導致的,因此把參數放在前面介紹,了解了參…

uniapp nvue開發App 橫豎屏切換丟失上下文導致 setTimeout和clearTimeout報錯

報錯內容如下 [JS Framework] Failed to find taskCenter (35). [JS Framework] Failed to execute the callback function:TypeError: c.clearTimeout is not a function reportJSException >>>> exception function:__WEEX_CALL_JAVASCRIPT__, exception:JavaSc…