人工智能數學基礎(五):概率論

? ?概率論是人工智能中處理不確定性的核心工具,它為機器學習、數據科學和統計分析提供了理論基礎。本文將深入淺出地介紹概率論的重要概念,并結合 Python 實例,幫助讀者更好地理解和應用這些知識。資源綁定附上完整資源供讀者參考學習!

5.1 概述

5.1.1 概率論的發展簡史

? ? 概率論起源于 17 世紀對賭博問題的研究,帕斯卡和費馬的通信奠定了其基礎。隨后,貝葉斯、高斯等科學家的貢獻推動了概率論的發展,使其在現代科學中廣泛應用。

5.1.2 概率論的主要內容

? ? 概率論主要研究隨機現象的規律性,包括隨機事件、隨機變量、概率分布、期望、方差以及大數定理和中心極限定理等。

5.2 隨機事件及其概率

5.2.1 隨機事件的運算

? ?隨機事件的運算包括事件的并、交、差和補集等。這些運算遵循集合運算的規則,用于構建復雜的事件。

5.2.2 隨機事件的概率

? ? 概率是衡量隨機事件發生可能性大小的數值。它滿足非負性、規范性和可加性三個基本性質。

5.2.3 條件概率

? ? 條件概率是指在事件 B 發生的條件下,事件 A 發生的概率,記為 P(A|B)。其計算公式為 P(A|B) = P(AB)/P(B),其中 P(B) ≠ 0。

綜合案例及應用:拋擲骰子事件

案例描述 :計算拋擲兩個骰子時,點數之和大于 8 的概率。

import itertools# 生成所有可能的骰子點數組合
dice_rolls = list(itertools.product(range(1, 7), repeat=2))# 計算有利事件數目
favorable_outcomes = [roll for roll in dice_rolls if sum(roll) > 8]# 計算概率
probability = len(favorable_outcomes) / len(dice_rolls)
print("拋擲兩個骰子點數之和大于 8 的概率為:", probability)

5.3 隨機變量

5.3.1 隨機變量的概率分布

? ? 隨機變量的概率分布描述了隨機變量取各個可能值的概率規律。常見的分布包括離散型(如二項分布、泊松分布)和連續型(如正態分布、指數分布)。

5.3.2 隨機變量的數字特征

? ? 數字特征包括期望(均值)、方差和標準差,用于描述隨機變量的集中趨勢和離散程度。

5.3.3 常見的概率分布

  • 二項分布 :描述 n 次獨立伯努利試驗中成功的次數。

  • 泊松分布 :描述單位時間(或空間)內隨機事件發生的次數。

  • 正態分布 :自然界中最常見的分布之一,具有鐘形曲線。

  • 指數分布 :描述泊松過程中的事件發生間隔時間。

綜合案例及應用:正態分布的概率計算

案例描述 :計算某地成年人身高服從均值為 170cm,標準差為 10cm 的正態分布,求身高在 160cm 到 180cm 之間的概率。

import numpy as np
import scipy.stats as stats# 正態分布參數
mu = 170  # 均值
sigma = 10  # 標準差# 計算概率
prob = stats.norm(mu, sigma).cdf(180) - stats.norm(mu, sigma).cdf(160)
print("身高在 160cm 到 180cm 之間的概率為:", prob)

5.4 貝葉斯理論

5.4.1 貝葉斯公式的推導

? ?貝葉斯公式是基于條件概率的逆概率計算公式,用于更新事件發生的概率。公式為 P(A|B) = P(B|A)P(A) / P(B)。

5.4.2 貝葉斯公式的應用舉例

? ? 在醫學診斷、垃圾郵件過濾等領域,貝葉斯公式可用于更新事件發生的概率。例如,計算患者患病的概率。

5.4.3 貝葉斯理論的前景

? ? 貝葉斯理論在機器學習中具有重要地位,如貝葉斯分類器、貝葉斯網絡等。它為模型的不確定性和概率推理提供了有力工具。

綜合案例及應用:疾病診斷

案例描述 :某疾病的發病率為 0.1%,檢測該疾病的實驗準確率為 99%(即患者檢測為陽性的概率為 99%,非患者檢測為陰性的概率為 99%)。求某人檢測為陽性時患病的概率。

# 疾病發病率
p_disease = 0.001# 檢測準確率
p_positive_given_disease = 0.99  # 患者檢測為陽性的概率
p_negative_given_healthy = 0.99  # 非患者檢測為陰性的概率# 計算貝葉斯公式中的各項
p_positive = p_disease * p_positive_given_disease + (1 - p_disease) * (1 - p_negative_given_healthy)# 計算患病概率
p_disease_given_positive = (p_positive_given_disease * p_disease) / p_positive
print("檢測為陽性時患病的概率為:", p_disease_given_positive)

5.5 極限理論

5.5.1 收斂

? ? 收斂是指隨機變量序列逐漸趨近于某個值或分布的過程。包括幾乎必然收斂、依概率收斂和依分布收斂等。

5.5.2 大數定理

? ? ?大數定理說明,隨著試驗次數增加,事件發生的頻率逐漸穩定于其概率。例如,伯努利大數定理表明,事件發生的頻率依概率收斂于其概率。

5.5.3 中心極限定理

? ? 中心極限定理指出,大量獨立同分布的隨機變量之和近似服從正態分布。這解釋了正態分布在自然現象中的普遍性

綜合案例及應用:中心極限定理仿真實驗

案例描述 :從均勻分布中抽取大量樣本,計算樣本均值,并驗證中心極限定理。

import numpy as np
import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 抽取樣本并計算均值
sample_means = []
for _ in range(10000):sample = np.random.uniform(0, 1, 100)sample_means.append(np.mean(sample))# 繪制直方圖
plt.figure(figsize=(8, 6))
plt.hist(sample_means, bins=30, density=True, alpha=0.6, color='g')
plt.xlabel('樣本均值')
plt.ylabel('頻率')
plt.title('中心極限定理仿真實驗')
plt.grid(True)
plt.show()

5.6 實驗:基于 Python 的泊松分布仿真實驗

5.6.1 實驗目的

? ?理解泊松分布的特點,并掌握使用 Python 進行泊松分布模擬的方法。

5.6.2 實驗要求

? ?生成泊松分布的隨機樣本,繪制其概率質量函數,并計算其期望和方差。

5.6.3 實驗原理

? ?泊松分布用于描述單位時間(或空間)內隨機事件發生的次數,其概率質量函數為 P(X=k) = λ^k e^{-λ} / k!,其中 λ 是平均發生率。

5.6.4 實驗步驟

  1. 導入必要的 Python 庫(NumPy 和 Matplotlib)。

  2. 設置泊松分布的參數 λ。

  3. 生成泊松分布的隨機樣本。

  4. 計算樣本的均值和方差。

  5. 繪制泊松分布的概率質量函數。

5.6.5 實驗結果

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as statsplt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 設置參數
lam = 2  # 泊松分布的平均發生率
num_samples = 10000  # 生成的樣本數量# 生成泊松分布的隨機樣本
samples = np.random.poisson(lam, num_samples)# 計算樣本均值和方差
sample_mean = np.mean(samples)
sample_variance = np.var(samples)print("樣本均值:", sample_mean)
print("樣本方差:", sample_variance)# 繪制概率質量函數
k = np.arange(0, 10)
pmf = stats.poisson.pmf(k, lam)plt.figure(figsize=(8, 6))
plt.bar(k, pmf, align='center', alpha=0.6)
plt.xlabel('隨機變量取值')
plt.ylabel('概率')
plt.title('泊松分布概率質量函數')
plt.grid(True)
plt.show()

5.7 概率論知識點表格總結

概念定義與說明常見應用
隨機事件在隨機試驗中可能出現的結果事件的并、交、差、補集
隨機變量將隨機事件映射為數值的變量離散型和連續型隨機變量,概率分布,期望,方差
貝葉斯公式基于條件概率的逆概率計算公式垃圾郵件過濾,疾病診斷
極限理論研究隨機變量序列的收斂性和大樣本性質大數定理,中心極限定理

? ?通過本文的學習,希望大家對概率論在人工智能中的應用有了更深入的理解。在實際操作中,多進行代碼練習,可以更好地掌握這些數學工具,為人工智能的學習和實踐打下堅實的基礎。資源綁定附上完整資源供讀者參考學習!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/77912.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/77912.shtml
英文地址,請注明出處:http://en.pswp.cn/web/77912.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MCP協議:自然語言與結構化數據的雙向橋梁 ——基于JSON-RPC 2.0的標準化實踐

MCP協議:自然語言與結構化數據的雙向橋梁 ——基于JSON-RPC 2.0的標準化實踐 一、MCP的本質:標準化共識的協議框架 MCP(Model Context Protocol)是Anthropic于2024年提出的開放通信協議,其核心價值在于建立自然語言…

vue+django農產品價格預測和推薦可視化系統[帶知識圖譜]

文章結尾部分有CSDN官方提供的學長 聯系方式名片 文章結尾部分有CSDN官方提供的學長 聯系方式名片 關注B站,有好處! ?編號:D010 vue django 前后端分離架構搭建的系統帶有推薦算法、價格預測、可視化、知識圖譜數據從爬蟲獲取可以更新到最…

verilog_testbench技巧

forever語句 forever begin state; end 一直執行state repeat(n) begin state; end 執行state,n次 force語句對雙向端口進行輸入賦值。 與wait 是邊沿觸發,wait是電平觸發 仿真控制語句與系統任務描述 $stop停止仿真…

實時時鐘(RTC)從原理到實戰

1. RTC技術深度解析 1.1 RTC核心概念 實時時鐘(Real-Time Clock,RTC)是嵌入式系統中獨立于主處理器的特殊計時電路,其核心功能在于提供持續可靠的時間基準。與CPU時鐘不同,RTC具有以下關鍵特性: 獨立供電…

pyspark將hive數據寫入Excel文件中

不多解釋直接上代碼,少python包的自己直接下載 #!/usr/bin/env python # -*- encoding: utf-8 -*- from pyspark.sql import SparkSession import pandas as pd import os# 初始化 SparkSession 并啟用 Hive 支持 spark SparkSession.builder \.appName("sel…

Stack--Queue 棧和隊列

一、Stack--棧 1.1 什么是棧? 堆棧是一種容器適配器,專門設計用于在 LIFO 上下文(后進先出)中運行,其中元素僅從容器的一端插入和提取。 第一個模版參數T:元素的類型;第二個模版參數Container…

用Python做有趣的AI項目1:用 TensorFlow 實現圖像分類(識別貓、狗、汽車等)

項目目標 通過構建卷積神經網絡(CNN),讓模型學會識別圖片中是什么物體。我們將使用 CIFAR-10 數據集,它包含 10 類:飛機、汽車、鳥、貓、鹿、狗、青蛙、馬、船和卡車。 🛠? 開發環境與依賴 安裝依賴&…

3D可視化編輯器模版

體驗地址:http://mute.turntip.cn 整個搭建平臺核心模塊包含如下幾個部分: 3D場景渲染 組件拖拽系統 元素編輯功能 狀態管理 歷史記錄與撤銷/重做 技術棧 前端框架與庫 React 18 用于構建用戶界面的JavaScript庫 Next.js 14 React框架,提供服…

“連接世界的橋梁:深入理解計算機網絡應用層”

一、引言 當你瀏覽網頁、發送郵件、聊天或觀看視頻時,這一切都離不開計算機網絡中的應用層(Application Layer)。 應用層是網絡協議棧的最頂層,直接為用戶的各種應用程序提供服務。它為用戶進程之間建立通信橋梁,屏蔽了…

JavaScript 代碼搜索框

1. 概述與需求分析 功能&#xff1a;在網頁中實時搜索用戶代碼、關鍵字&#xff1b;展示匹配行、文件名&#xff1b;支持高亮、正則、模糊匹配。非功能&#xff1a;大文件集&#xff08;幾十萬行&#xff09;、高并發、響應 <100ms&#xff1b;支持增量索引和熱更新。 2. …

【運維】Ubuntu apt 更新失敗?Temporary failure resolving ‘cn.archive.ubuntu.com‘ 問題

Ubuntu apt 更新失敗&#xff1f;Temporary failure resolving ‘cn.archive.ubuntu.com’ 問題 在使用 Ubuntu 時&#xff0c;你是否遇到過這樣一個煩人的錯誤&#xff1a; Temporary failure resolving ‘cn.archive.ubuntu.com’ 如果你也踩坑了&#xff0c;別慌&#xff0…

Uniapp:showLoading(等待加載)

目錄 一、出現場景二、效果展示三、具體使用一、出現場景 在項目的開發中,我們經常會請求后臺接口返回數據,但是每一個接口返回數據的時間不一致,有的快,有的慢,這個時候如果不加一個遮罩層,接口返回慢的時候,非常影響用戶體驗 二、效果展示 三、具體使用 顯示加載框…

【11408學習記錄】英語書信通知寫作模板大全:5個高分句式+使用場景解析,速存每日一句拆解練習!

書信/通知寫作錦囊妙句 英語寫作——19個錦囊妙句妙句9妙句10妙句11妙句12妙句13 每日一句詞匯第一步&#xff1a;找謂語第二步&#xff1a;斷句第三步&#xff1a;簡化讓步狀語從句限定性同位語從句主句 英語 寫作——19個錦囊妙句 妙句9 故宮在中國人民中很受歡迎/評價很高…

Unity 粒子同步,FishNet

Github的工程 同步畫面 使用FishNet插件同步&#xff0c;可使用這個選項來克隆第二個項目進行測試

【hadoop】案例:MapReduce批量寫入HBase

1.需求分析 我們仍然以美國各個氣象站每年的氣溫數據集為例&#xff0c;現在要求使用MapReduce讀取該數據集&#xff0c;然后批量寫入HBase數據庫&#xff0c;最后利用HBase shell根據行鍵即席查詢氣溫數據。 2.數據集準備 數據集的文件名為temperature.log&#xff0c;里面包含…

【linux網絡】網絡基礎概念

1. 初始協議 1.1 OSI 七層模型 OSI&#xff08;Open System Interconnection&#xff0c;開放系統互連&#xff09;七層網絡模型稱為開放式系統互聯參考模型&#xff0c;是一個邏輯上的定義和規范&#xff1b; 把網絡從邏輯上分為了 7 層. 每一層都有相關、相對應的物理設備&a…

【Android】談談DexClassLoader

一,Dex和Jar DEX 文件(Dalvik Executable)相較于普通的 JAR(Java 字節碼 .class 文件)進行了多方面的優化,主要是為了適應 Android 設備的性能和資源限制(例如內存、存儲空間和處理能力)。以下是 DEX 文件的一些具體優化點: 1. 內存占用優化 合并類文件: DEX 文件將…

【Flutter】Unity 三端封裝方案:Android / iOS / Web

關聯文檔&#xff1a;【方案分享】Flutter Unity 跨平臺三維渲染架構設計全解&#xff1a;插件封裝、通信機制與熱更新機制—— 支持 Android/iOS/Web 的 3D 內容嵌入與遠程資源管理&#xff0c;助力 XR 項目落地 —— 支持 Android/iOS/Web 的 3D 內容嵌入與遠程資源管理&…

Html1

一&#xff0c;HTML概述 網頁開發需要學習的知識&#xff1a; html css javaScript 兩個框架 VUE.js ElementUI UI user interface 用戶界面 HTML xml 可擴展標記語言-->存儲數據 Markup Language標簽語言都會提供各種標…

一、I/O的相關概念

I/O的相關概念 1、I/O I/O即Input和Output&#xff0c;用戶進程執行I/O操作&#xff0c;歸結起來&#xff0c;也就是向操作系統發出請求&#xff0c;讀請求就把數據填到緩沖區里&#xff0c;寫數據就把緩沖區里數據排干&#xff0c;目的地可以是磁盤也可以是其他通道。進程通…