AI小白的第七天:必要的數學知識(概率)

概率 Probability

1. 概率的定義

概率是一個介于 0 和 1 之間的數,表示某個事件發生的可能性:

  • 0:事件不可能發生。
  • 1:事件必然發生。
  • 0 到 1 之間:事件發生的可能性大小。

例如,擲一枚公平的硬幣,正面朝上的概率是 0.5。


2. 概率的計算

(1)頻率學派

拋一萬次硬幣,看硬幣正面向上的概率。
P n ( x ) = n x n P_n(x)=\frac{n_x}{n} Pn?(x)=nnx??

  • x x x代表證明朝上;
  • n n n為實驗總數;
  • n x n_x nx?為實驗過程中發生x的次數。

這種方式,實驗成本高,且誤差不可控,概率始終是個近似值。

(2)古典學派

樣本空間中,每個結果發生的可能性相等,則事件A的概率為:
P ( A ) = ∣ A ∣ ∣ S ∣ P(A)=\frac{|A|}{|S|} P(A)=SA?

  • 其中|A|是事件A的結果數
  • |S|是樣本空間的結果數
(3)貝葉斯學派

P ( A ∣ B ) = P ( B ∣ A ) ? P ( A ) P ( B ) P(A|B)=\frac{P(B|A) \cdot P(A)}{P(B)} P(AB)=P(B)P(BA)?P(A)?

  • P(A)表示事件A發生的概率,稱為先驗(prior)概率;
  • P(B)表示事件B發生的概率,稱為標準化常量或者證據(evidence);
  • P(B|A)表示在事件A發生的條件下,事件B發生的概率,通常稱之為可能性或者似然(likelihood);
  • P(A|B)表示在事件B發生的條件下,事件A發生的概率,也稱為后驗(posterior),也就是表示了事件發生了,并且它屬于某一類別的概率;

在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述

最大似然估計 Maximum Likelihood Estimation, MLE

1. 基本概念

  • 參數估計:在統計學中,我們通常假設數據服從某個概率分布(如正態分布、泊松分布等),而分布的參數(如均值、方差)需要通過數據來估計。
  • 似然函數:給定一組參數,似然函數描述了觀測數據在該參數下出現的概率。
  • 最大似然估計:通過最大化似然函數,找到最可能生成觀測數據的參數值。

θ ^ = a r g m a x P ( X ∣ θ ) \hat \theta =argmaxP(X|\theta) θ^=argmaxP(Xθ)

  • θ ^ \hat \theta θ^ 是最優參數
  • a r g m a x argmax argmax表示求使得 P ( X ∣ θ ) P(X|\theta) P(Xθ)最大化的參數值。

2. 似然函數的定義

假設觀測數據為 X = x 1 , x 2 , . . . , x 3 X={x_1,x_2,...,x_3} X=x1?,x2?,...,x3?,且數據服從某個概率分布 P ( X ∣ θ ) P(X|\theta) P(Xθ),其中 θ \theta θ是分布的參數。似然函數定義為

L ( θ ) = P ( X ∣ θ ) = ∏ i = 1 n P ( x i ∣ θ ) L(\theta)=P(X|\theta)=\prod_{i=1}^n P(x_i|\theta) L(θ)=P(Xθ)=i=1n?P(xi?θ)

3. 最大似然估計的步驟

(1)寫出似然函數

根據數據分布假設,寫出似然函數 L ( θ ) L(θ) L(θ)

(2)取對數似然函數

為了簡化計算,通常對似然函數取對數,得到對數似然函數:
ln ? L ( θ ) = ∑ i = 1 n ln ? P ( x i ∣ θ ) \ln L(\theta) = \sum_{i=1}^n \ln P(x_i|\theta) lnL(θ)=i=1n?lnP(xi?θ)

(3)取對數似然函數

對對數似然函數關于參數 θ θ θ 求導,并令導數為零,求解使似然函數最大的參數值:
d d θ ln ? L ( θ ) = 0 \frac{d}{d\theta}\ln L(\theta) =0 dθd?lnL(θ)=0

(4)求解參數

解上述方程,得到參數的估計值 θ ^ \hat \theta θ^

關于“最大似然值估計”,我明白它干的事情了,但是過程現在實在是沒搞懂,暫時先放一放,后面想通了以后專門出一篇理解的過程。

概率分布

在計算最大似然值的時候,要選對概率分布的類型。

a.伯努利分布(Bernoulli Distribution)**
  • 定義只有兩個可能結果的單次試驗的概率分布,即成功和失敗。
  • 參數:成功的概率 $p$(0 ≤ p ≤ 1)。
  • 概率質量函數(PMF):P(X=1) = p, P(X=0) = 1-p。
b. 二項分布(Binomial Distribution)
  • 定義:在固定次數的獨立試驗中,每次試驗只有兩種可能結果(成功或失敗),且每次試驗成功的概率相同的概率分布。
  • 參數:試驗次數 $n$ 和成功的概率 $p$。
  • 概率質量函數(PMF):P(X=k) = C(n, k) × p^k × (1-p)^(n-k),其中 C(n, k) 是組合數,即從 n 個不同元素中取出 k 個元素的組合方式數量。
c. 泊松分布(Poisson Distribution)
  • 定義:用于預測在固定時間間隔內某事件平均發生 $λ$ 次的條件下,該事件實際發生 $k$ 次的概率。
  • 參數:事件發生的平均率 $λ$(λ > 0)。
  • 概率質量函數(PMF):P(X=k) = (λ^k / k!) × e^(-λ)。

2. 連續型概率分布

a. 均勻分布(Uniform Distribution)
  • 定義:在某一區間 [a, b] 內所有值出現的概率相等的概率分布。
  • 參數:區間的下限 $a$ 和上限 $b$(a < b)。
  • 概率密度函數(PDF):f(x) = 1 / (b - a)(當 a ≤ x ≤ b 時);否則 f(x) = 0。
b. 正態分布(Normal Distribution)/高斯分布(Gaussian Distribution)
  • 定義:最常見的連續概率分布之一,許多自然現象都近似服從正態分布。
  • 參數:均值 $μ$ 和標準差 $σ$(σ > 0)。
  • 概率密度函數(PDF):f(x) = (1 / (√(2π)σ)) × e[-(x-μ)2 / (2σ^2)]。
c. 指數分布(Exponential Distribution)
  • 定義:描述兩個相繼發生的事件之間的時間間隔的概率分布,常用于可靠性理論和排隊論。
  • 參數:率參數 $λ$(λ > 0),與泊松分布的 $λ$ 相關,但意義不同。
  • 概率密度函數(PDF):f(x) = λe^(-λx)(當 x ≥ 0 時);否則 f(x) = 0。

3. 其他重要分布

a. 卡方分布(Chi-Squared Distribution)
  • 定義:與正態分布的樣本方差有關的概率分布,常用于假設檢驗。
  • 參數:自由度 $ν$(ν 為正整數)。
b. t分布(Student’s t-Distribution)
  • 定義:在小樣本情況下估計總體均值的統計量的分布,常用于假設檢驗。
  • 參數:自由度 $ν$(ν 為正整數)。
c. F分布(F-Distribution)
  • 定義:兩個獨立的卡方分布變量的比率的分布,常用于方差分析。
  • 參數:分子自由度 $ν_1$ 和分母自由度 $ν_2$(兩者均為正整數)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/74071.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/74071.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/74071.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

UE5 + Rider + VsCode 接入騰訊的 Puerts 腳本

學習了一段時間 U&#xff0c;寫點啥就得等編譯&#xff0c;體驗真的是一言難盡。。。。。。 然后就想著給自己找個腳本好了&#xff0c;調研了一下 AngelScript&#xff0c;puerts 的可行性。 AngelScript 看著真的誘人&#xff0c;但是發現連官方提供的都是 UE 的預編譯版本…

凸包構造算法—Graham 掃描法

1. 理論原理推導 核心思想 Graham 掃描法基于以下基本思想&#xff1a; 極角排序&#xff1a; 選取一個參考點&#xff08;通常選擇 y 坐標最小的點&#xff0c;若存在多個&#xff0c;則選 x 坐標最小的&#xff09;&#xff0c;將其他點按照與該參考點構成的極角進行升序排…

如何在 Windows 上安裝與配置 Tomcat

Apache Tomcat 是一個開源的 Servlet 容器和 Web 服務器&#xff0c;廣泛用于 Java Web 應用的開發和部署。它是實現 Java EE&#xff08;現稱 Jakarta EE&#xff09;規范中的 Servlet 和 JSP 的官方參考實現。在本文中&#xff0c;我們將詳細介紹如何在 Windows 系統上安裝并…

測試模版15

本篇技術博文摘要 &#x1f31f; 引言 &#x1f4d8; 在這個變幻莫測、快速發展的技術時代&#xff0c;與時俱進是每個IT工程師的必修課。我是盛透側視攻城獅&#xff0c;一名什么都會一丟丟的網絡安全工程師&#xff0c;也是眾多技術社區的活躍成員以及多家大廠官方認可人員&a…

攔截、限流,針對場景詳細信息(一)

以下是一個基于Java Spring Boot Redis 的完整限流實現案例&#xff0c;針對同一接口前綴&#xff08;如 /one/ &#xff09;的IP訪問頻率控制&#xff1a; 場景&#xff1a;用戶不用登錄即可訪問接口&#xff0c;網站會有被攻擊的風險 URL&#xff1a;one/two/three one/…

計算機視覺算法實戰——煙霧檢測

?個人主頁歡迎您的訪問 ?期待您的三連 ? ?個人主頁歡迎您的訪問 ?期待您的三連 ? ?個人主頁歡迎您的訪問 ?期待您的三連? ??? ????????? ?? 1. 煙霧檢測領域介紹 煙霧檢測是計算機視覺在公共安全領域的重要應用&#xff0c;它通過分析視頻或圖像序…

MySQL-DCL函數

DCL DCL英文全稱是Data Control Language(數據控制語言)&#xff0c;用來管理數據庫用戶、控制數據庫的訪問權限。 管理用戶 1). 查詢用戶 use mysql; select * from user; select * from mysql.user; 查詢的結果如下: 其中 Host代表當前用戶訪問的主機, 如果為localhost, 僅…

linux 服務器創建服務器啟動后服務自啟動

1、在/etc/systemd/system/下touch一個文件&#xff1a; touch /etc/systemd/system/your_application.service 2、在文件中寫入&#xff1a; [Unit] Descriptionmodules-system Aftersyslog.target[Service] Typeforking Userroot Grouproot ExecStart/bin/bash /usr/loca…

端到端語音識別案例

《DeepSeek大模型高性能核心技術與多模態融合開發&#xff08;人工智能技術叢書&#xff09;》(王曉華)【摘要 書評 試讀】- 京東圖書 語音識別這一技術正如其名&#xff0c;是通過精密地解析說話人的語音來識別并準確轉寫出其所說的內容。它不僅僅是一個簡單的轉錄過程&#…

QT——信號和槽

QT是圖形化界面&#xff0c;自然是需要與用戶進行交互的&#xff0c;但是該如何實現用戶與界面或者程序的交互呢。答案是通過信號和槽。 一&#xff0c;什么是信號和槽&#xff1f; 在Linux操作系統里面&#xff0c;我們知道信號是由硬件或者軟件產生&#xff0c;但是在QT里面…

Q:如何保證備份的有效性以及備份頻率設置的優化方案?

1、如何保障備份數據的一致性 a) 快照 快照通過捕獲數據在某一時刻的完整狀態來保障備份一致性。在應用層&#xff0c;快照會暫停業務寫入或生成事務一致性檢查點&#xff08;如數據庫的全局讀視圖&#xff09;&#xff0c;確保備份數據不包含未提交的事務&#xff1b;在存…

Linux實用操作及命令

一、各類小技巧&#xff08;快捷鍵&#xff09; 1、強制停止&#xff08;ctrlc&#xff09; Linux某些程序的運行&#xff0c;如果想要強制停止它&#xff0c;可以使用快捷鍵ctrl c 命令輸入錯誤&#xff0c;也可以通過快捷鍵ctrl c&#xff0c;退出當前輸入&#xff0c;重…

壓測工具開發(一)——使用Qt Designer構建簡單界面

你好&#xff0c;我是安然無虞。 文章目錄 項目功能概述構建菜單欄、工具欄1. 菜單欄注意事項2. 工具欄注意事項3. 日志停靠窗口 項目功能概述 開發一款 Qt版本的壓測工具, 可以用來做 基于HTTP API接口的 性能測試. 要求做一個 MDI 多功能子窗口的 圖形界面程序, 方便公司內…

Ubuntu 22 Linux上部署DeepSeek R1保姆式操作詳解(ollama方式)

操作系統&#xff1a;Ubuntu Linux 22.04 一、安裝模型運行環境 打開鏈接https://ollama.com/download/linux 1.安裝ollama &#xff08;1&#xff09;一條指令即可實現的簡易版安裝方法&#xff08;也可稱為在線安裝&#xff09; curl -fsSL https://ollama.com/install.s…

MySQL 和 Redis 數據一致性解決方案

MySQL 和 Redis 數據一致性解決方案 MySQL 和 Redis 作為兩種不同類型的數據庫(關系型 vs 內存型)&#xff0c;在配合使用時需要特別注意數據一致性問題。以下是幾種常見的解決方案&#xff1a; 1. 緩存更新策略 1.1 Cache Aside Pattern (旁路緩存模式) 讀操作&#xff1a…

Java高頻面試之集合-20

hello啊&#xff0c;各位觀眾姥爺們&#xff01;&#xff01;&#xff01;本baby今天來報道了&#xff01;哈哈哈哈哈嗝&#x1f436; 面試官&#xff1a;講講 HashSet 的底層實現&#xff1f; HashSet 是 Java 集合框架中用于存儲唯一元素的高效數據結構&#xff0c;其底層實…

【MySQL】從零開始:掌握MySQL數據庫的核心概念(四)

人們之所以不愿改變&#xff0c;是因為害怕未知。但歷史唯一不變的事實&#xff0c;就是一切都會改變。 前言 這是我自己學習mysql數據庫的第四篇博客總結。后期我會繼續把mysql數據庫學習筆記開源至博客上。 上一期筆記是關于mysql數據庫的表格約束&#xff0c;沒看的同學可以…

Manus:通用智能體的架構革命與產業破局

&#x1f90d; 前端開發工程師、技術日更博主、已過CET6 &#x1f368; 阿珊和她的貓_CSDN博客專家、23年度博客之星前端領域TOP1 &#x1f560; 牛客高級專題作者、打造專欄《前端面試必備》 、《2024面試高頻手撕題》、《前端求職突破計劃》 &#x1f35a; 藍橋云課簽約作者、…

HTTP協議手寫服務器

目錄 一、請求的是Web根目錄 二、GET方法通過URL傳參 三、根據資源類型對應出Content-Type值 四、Http代碼 項目完整源代碼&#xff1a;Http 周不才/cpp_linux study - 碼云 - 開源中國 一、請求的是Web根目錄 如果URL中請求的資源是Web根目錄&#xff0c;則自動跳轉到主…

小藍和鑰匙

錯位排序組合數 從28個人里面選14個人分到原來房間的鑰匙 C 28 14 另外14個人錯位排序 模板 請在此處填寫你的解題思路 D14 都是模板記住就好了 無需理解 做題可以看出來是錯位排序 或者組合數 然后會寫代碼就行了 import java.util.Scanner;/*** author zb* date2025/3…