西南交通大學【機器學習實驗7】

實驗目的

理解和掌握樸素貝葉斯基本原理和方法,理解極大似然估計方法,理解先驗概率分布和后驗概率分布等概念,掌握樸素貝葉斯分類器訓練方法。

實驗要求

給定數據集,編程實現樸素貝葉斯分類算法,計算相應先驗概率,條件概率,高斯分布均值和方差的估計值,并給出模型在測試集上的精度。

實驗環境

python, numpy, scipy

實驗代碼

import numpy as npfrom scipy.stats import norm# 導入訓練數據train_dataset_data = np.genfromtxt("experiment_07_training_set.csv", delimiter=",", skip_header=1, usecols=(1, 2, 3, 4))rowOfTrainDataset = train_dataset_data.shape[0]train_dataset_label = np.genfromtxt("experiment_07_training_set.csv", delimiter=",", skip_header=1, usecols=(5,), dtype="str")# 導入測試數據test_dataset_data = np.genfromtxt("experiment_07_testing_set.csv", delimiter=",", skip_header=1, usecols=(1, 2, 3, 4))rowOfTestDataset = test_dataset_data.shape[0]test_dataset_label = np.genfromtxt("experiment_07_testing_set.csv", delimiter=",", skip_header=1, usecols=(5,), dtype="str")# 定義種類列表和屬性列表species = ["Iris-setosa", "Iris-versicolor", "Iris-virginica"]xs = ["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]# 統計先驗概率prior = np.zeros(3)for i in range(3):prior[i] = np.sum(train_dataset_label == species[i], axis=0) / rowOfTrainDatasetprint("先驗概率: ")for i in range(3):print(f"{species[i]}-> {prior[i]}")# 計算條件概率condition = np.zeros((3, 4, 2))# 對3個類別計算for i in range(3):# 每個類別4個屬性for j in range(4):temp = train_dataset_data[train_dataset_label == species[i], j]# 存儲均值condition[i, j, 0] = np.mean(temp)# 存儲標準差condition[i, j, 1] = np.sqrt(np.var(temp))print(f"高斯分布參數估計:")for i in range(3):print(f"P(X|Y={species[i]})->", end='')for j in range(4):print(f"|X1={xs[j]}:均值->{condition[i, j, 0]:.4f} 標準差->{condition[i, j, 1]: .4f}|", end=' ')print("")# 計算精度pred = np.zeros_like(test_dataset_label)for i in range(rowOfTestDataset):# 將概率初始化為0probability1 = 0# 計算3種類別的概率取最大概率作為種類for j in range(3):p0 = norm.pdf(test_dataset_data[i, 0], loc=condition[j, 0, 0], scale=condition[j, 0, 1])p1 = norm.pdf(test_dataset_data[i, 1], loc=condition[j, 1, 0], scale=condition[j, 1, 1])p2 = norm.pdf(test_dataset_data[i, 2], loc=condition[j, 2, 0], scale=condition[j, 2, 1])p3 = norm.pdf(test_dataset_data[i, 3], loc=condition[j, 3, 0], scale=condition[j, 3, 1])probability2 = prior[j] * p0 * p1 * p2 * p3if probability2 > probability1:pred[i] = jprobability1 = probability2# 將類別從編號轉為字符串pred_species = np.array([species[int(p)] for p in pred])# 計算精度accuracy = np.sum(pred_species == test_dataset_label) / rowOfTestDatasetprint(f"模型精度: {accuracy * 100: .2f}%")

結果分析

先驗概率

類別

先驗概率

P(Y=setosa)

0.4

P(Y=versicolor)

0.4

P(Y=virginica)

0.2

高斯分布參數估計精度:

類別

X1=SepalLength

X2=SepalWidth

X3=PetalLength

X4=PetalWidth

均值

標準差

均值

標準差

均值

標準差

均值

標準差

P(X|Y=setosa)

5.0375

0.3576

3.4400

0.3597

1.4625

0.1698

0.2325

0.0985

P(X|Y=versicolor)

6.0150

0.5126

2.7875

0.3257

4.3200

0.4440

1.3500

0.2049

P(X|Y=virginica)

6.5600

0.7130

2.9200

0.3763

5.6550

0.6241

2.0450

0.2673

模型精度:

92.00%

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/89491.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/89491.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/89491.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

java生成pdf文件

1.依賴 <dependency><groupId>com.itextpdf</groupId><artifactId>itext-core</artifactId><version>8.0.4</version><type>pom</type></dependency> 2.代碼 package org.example;import com.itextpdf.io.image…

macOS掛載iOS應用沙盒文件夾

背景 工具 libimobiledevice: linux&#xff0c;macOS等與ios設備通信是的工具 macFUSE 是 macOS 文件系統擴展的“引擎”&#xff0c;支持開發者創建各類虛擬文件系統。 iFUSE 是專為 iOS 設備設計的“連接器”&#xff0c;需依賴 macFUSE 實現功能。 若需訪問 iPhone/iP…

嵌入式軟件面經(四)Q:請說明在 ILP32、LP64 與 LLP64 三種數據模型下,常見基本類型及指針的 sizeof 值差異,并簡要解釋其原因

從事嵌入式開發深入理解 ILP32、LP64、LLP64 三種主流數據模型及其在平臺上的實際表現&#xff0c;可以幫助我們避免諸如類型越界、結構錯位、指針截斷等致命錯誤。 一、何為數據模型&#xff1f;為何重要&#xff1f; 數據模型&#xff08;Data Model&#xff09;是指在某一編…

計算機組成原理與體系結構-實驗二 ALU(Proteus 8.15)

目錄 一、實驗目的 二、實驗內容 三、實驗器件 四、實驗原理 五、實驗步驟 六、思考題 一、實驗目的 1、了解算術邏輯運算器&#xff08;74LS181&#xff09;的組成和功能。 2、掌握基本算術和邏輯運算的實現方法。 二、實驗內容 設計算數邏輯運算器系統的通路&#x…

ubuntu下免sudo執行docker

前言 在ubuntu中&#xff0c;默認是無法使用root賬號的&#xff0c;安裝完docker后&#xff0c;不可避免的要使用sudo來執行docker命令&#xff0c;這就讓運維變得很麻煩 避免sudo # 添加當前用戶到 docker 組 sudo usermod -aG docker $USER# 刷新組權限 newgrp docker# 驗…

微處理原理與應用篇---STM32寄存器控制GPIO

在 ARM 架構下使用 C 語言控制 32 位寄存器實現 GPIO 操作&#xff0c;需結合芯片手冊進行寄存器映射和位操作。以下以 STM32F103&#xff08;Cortex-M3 內核&#xff09;為例&#xff0c;詳細介紹實現方法&#xff1a; 一、STM32F103 GPIO 控制&#xff08;標準外設庫&#x…

基于OPUS-MT模型的中譯英程序實現

這是我的kaggle賬號名“fuliuqin” 代碼參考如下&#xff1a; nlp.paperflq | KaggleExplore and run machine learning code with Kaggle Notebooks | Using data from [Private Datasource]https://www.kaggle.com/code/fuliuqin/nlp-paperflq 目錄 緒論 研究背景與意義 研究…

炸雞派-定時器基礎例程

定時器簡介 基本定時器&#xff0c;計數中斷、產生DMA請求。 通用定時器&#xff0c;PWM輸出、輸入捕獲、脈沖計數。 高級定時器&#xff0c;輸出比較、互補輸出帶死區控制、PWM輸入。 中心對齊的計數模式可以生成對稱的PWM波形信號。計數可以先增后減。 這種模式下&#xff…

利用不坑盒子的Copilot,快速排值班表

馬上放暑假了&#xff0c;有多少人拼命排值班表的&#xff1f; 今天用我親身制作值班表的一些Excel操作&#xff0c;給大家分享一些在Excel中的小技巧&#xff0c;需要的及時收藏&#xff0c;有一天用得上~ 值班表全貌 先給大家看看我制作的值班表的樣子&#xff0c;應該大家…

Linux 面試知識(附常見命令)

目錄結構與重要文件 Linux 中一切皆文件&#xff0c;掌握目錄結構有助于理解系統管理與配置。 目錄說明/根目錄&#xff0c;所有文件起點/bin基本命令的可執行文件&#xff0c;如 ls, cp/sbin系統管理員用的命令&#xff0c;如 shutdown/etc配置文件目錄&#xff0c;如 /etc/…

Lua 安裝使用教程

一、Lua 簡介 Lua 是一門輕量級、高性能的腳本語言&#xff0c;具有簡潔語法、嵌入性強、可擴展性高等特點。廣泛應用于游戲開發&#xff08;如 Roblox、World of Warcraft&#xff09;、嵌入式開發、配置腳本、Nginx 擴展&#xff08;OpenResty&#xff09;等領域。 二、Lua …

SPAD像素概念理解

SPAD(Single Photon Avalanche Diode,單光子雪崩二極管)像素是一種能夠檢測單個光子的超靈敏光電探測器,其核心原理是通過雪崩倍增效應將單個光子產生的微弱電流信號放大到可觀測水平。 一、工作原理 雪崩倍增效應 當SPAD反向偏壓超過其擊穿電壓時,進入蓋革模式(Geiger M…

SSSSS

#include <iostream> void LineOf(bool** n1, bool** n2, int column, int raw, int* result) { for (int i 0; i < column; i) { int d -1, n -1; // 反向遍歷&#xff0c;找最后一個 true for (int j raw - 1; j > 0; j--) { …

【AI智能體】社交娛樂-智能助教

智能助教是扣子官方提供的教育類智能體模板。助教模板分為學習陪伴和作業批改兩種場景&#xff0c;分別適用于學生角色和教師角色&#xff0c;你可以根據需求選擇對應的模板&#xff0c;并將其改造為其他學科或其他教育階段的智能助教。 模板介紹 在智能學伴/助教的落地過程中…

自動化保護 AWS ECS Fargate 服務:使用 Prisma Cloud 實現容器安全

引言 在云原生時代,容器化技術已成為現代應用部署的標準方式。AWS ECS Fargate 作為一種無服務器容器服務,讓開發者能夠輕松運行容器化應用而無需管理底層基礎設施。然而,隨著容器技術的普及,安全問題也日益突出。本文將介紹如何通過 Python 腳本自動化地為 ECS Fargate 服…

Kafka Controller 元數據解析與故障恢復實戰指南

#作者&#xff1a;張桐瑞 文章目錄 1 生產案例&#xff1a;Controller 選舉在故障恢復中的關鍵作用1.1 問題背景1.2 核心操作原理&#xff1a; 2 Controller 元數據全景&#xff1a;從 ZooKeeper 到內存的數據鏡像2.1元數據核心載體&#xff1a;ControllerContext 類2.2核心元…

《尋北技術的全面剖析與應用前景研究報告》

一、引言 1.1 研究背景與意義 尋北&#xff0c;作為確定地理北極方向的關鍵技術&#xff0c;在眾多領域中扮演著舉足輕重的角色。在軍事領域&#xff0c;精確的尋北對于武器系統的瞄準、導彈的精確制導以及部隊的戰略部署都至關重要。例如&#xff0c;火炮在發射前需要精確尋…

深入比較 Gin 與 Beego:Go Web 框架的兩大選擇

引言 在 Go 語言生態系統中&#xff0c;Gin 和 Beego 是兩個非常受歡迎的 Web 框架。它們各自有著不同的設計理念和目標用戶群體。本文將對這兩個框架進行深入比較&#xff0c;并幫助你理解它們之間的區別&#xff0c;以便根據項目需求做出合適的選擇。 一、Gin 概述 Gin是一…

全新大模型開源,騰訊(int4能打DeepSeek) Vs 谷歌(2GB運行多模態)

大家好&#xff0c;我是 Ai 學習的老章 最近除了阿里 Qwen3 模型更新了圖片生成和處理能力&#xff0c;大家都可以玩轉吉卜力風格 還有幾個最近發布的大模型值得關注 1 是騰訊開源了 80B 混元 A13B 模型&#xff0c;亮點是精度無損的 int4 很能打 2 是谷歌開源的小參數 Gemm…

向量數據庫milvus中文全文檢索取不到數據的處理辦法

?檢查中文分詞配置? Milvus 2.5 支持原生中文全文檢索&#xff0c;但需顯式配置中文分詞器&#xff1a; 創建集合時指定分詞器類型為 chinese python schema.add_field(field_name"text", datatypeDataType.VARCHAR, max_length65535, enable_analyzerTrue, an…