人工智能原理復習--機器學習

文章目錄

  • 上一篇
  • 機器學習概述
  • 歸納(示例)學習
  • ID3決策樹算法
  • K近鄰算法
  • 下一篇

上一篇

人工智能原理復習–搜索策略(二)

機器學習概述

學習系統的基本結構

環境
學習
知識庫
執行



環境向系統的學習部分提供某些信息
學習利用這些信息修改數據庫,以怎金系統執行部分完成任務的效能
執行部分根據知識庫完成任務,同時把獲得的信息反饋給學習部分

最重要的因素是`環境向系統提供的信息

機器學習分類:

  • 監督學習:決策樹、支持向量機(SVM)、k-臨近算法(KNN)
  • 無監督學習:k-均值、DBSCAN密度聚類算法、最大期望算法
  • 強化學習:環境,獎勵,狀態 ,動作–> 狀態獎勵

歸納(示例)學習

歸納學習是一種通過觀察和分析現象,發現其中規律和模式,并據此進行預測和決策的方法。歸納學習的基本思想是通過從數據樣本中歸納出一般性規律或模式,從而實現對未知數據的預測和分類。

歸納學習是通過一系列的示例(正例和反例)出發,生成一個反映這些示例本質的定義:

  • 覆蓋所有的正例,而不包含任何反例
  • 可用來指導對新例子的分類識別

歸納學習過程可以分為以下幾個步驟:

  1. 數據采集:收集需要學習的數據樣本。
  2. 特征提取:從數據樣本中提取出有用的特征,用于歸納學習。
  3. 模型訓練:使用歸納學習算法從數據樣本中歸納出一般性規律或模式。
  4. 模型評估:使用測試數據對歸納模型進行評估,計算出模型的準確率和誤差。
  5. 模型應用:使用歸納模型對新的數據進行分類或預測。

概念描述搜索及獲取

  • 例子空間:所有可能的正例、反例構成的空間
  • 假設空間:所有可能的假設(概念描述)構成的空間
  • 頂層假設:最泛化的概念描述,不指定任何的特征值
  • 底層假設:最特化(具體)的概念描述,所有特征都給定特征值
  • 假設空間的搜索方法:1、特化搜索(寬度優先,自頂向下) 2、泛化搜索(寬度優先,自底向上) 3、雙向搜索(版本空間法)

ID3決策樹算法

信息的定量描述
衡量信息多少的物理量稱為信息量:

  • 若概率很大,受信者事先已有所估計,則該消息信息量就很小
  • 若概率很小,受信者感覺很突然,該信息所含信息量就很大

使用信息量函數 f ( p ) f(p) f(p)描述, f ( p ) f(p) f(p)條件:

  • f ( p ) f(p) f(p) 應是p的嚴格單調遞減函數
  • 當p = 1時, f ( p ) = 0 f(p) = 0 f(p)=0, 當p = 0時, f ( p ) = ∞ f(p) = \infty f(p)=
  • 當兩個獨立事件的聯合信息量應等于他們分別的信息量之和

信息量定義 :若一個消息 x x x 出現的的概率為 p p p, 則這一消息所含信息量為:
I = ? log ? p I = - \log{p} I=?logp

單位:

  • 以2為底,單位 b i t bit bit (常用)
  • 以e為底,單位 n a t nat nat
  • 以10為底,單位 h a r t hart hart

信息熵
所有可能消息的平均不確定性,信息量的平均值
H ( X ) = ? ∑ p ( x i ) log ? ( p ( x i ) ) H(X) = -\sum{p(x_i)\log{(p(x_i))}} H(X)=?p(xi?)log(p(xi?))

在這里插入圖片描述
定義:

  • M ( C ) M(C) M(C) 為根節點總的信息熵
  • B ( C , A ) B(C, A) B(C,A) 為根據A屬性分類后的加權信息熵的和,每一類占全部的比例作為加權,將分完之后的信息熵加權求和
  • g a i n = M ( C ) ? B ( C , A ) gain = M(C) - B(C,A) gain=M(C)?B(C,A)信息增益,信息增益越大越好

分別求出每個屬性的信息增益,然后將最大的作為這個節點的分類屬性

步驟:

  1. 首先求出根節點的信息熵
  2. 然后按每個特征求出對應的信息增益
  3. 比較得出最大的信息增益的特征作為給節點的劃分屬性
  4. 循環1-3步直到將全部類別分開,或者劃分比例達到要求值

d在這里插入圖片描述
ID3算法
優點:

  1. 計算復雜度不高
  2. 輸出結果易于理解
  3. 可以處理不相關特征數據

缺點:

  1. 不能處理帶有缺失值的數據集
  2. 在進行算法學習之前需要對數據集中的缺失值進行預處理
  3. 存在過擬合問題

K近鄰算法

一種監督學習分類算法,沒有學習過程,在分類時通過類別已知的樣本對新樣本的類別進行預測。

基本思路:

  1. 通過以某個數據為中心,分析離其最近的K個鄰居的類型,獲得該數據可能的類型
  2. 以少數服從多數的原理,推斷出測試樣本的類別

只要訓練樣本足夠多,K近鄰算法就能達到很好的分類效果

在這里插入圖片描述

  • 當K = 3時,即選擇最近的3個點,由于三角形樣本所占近鄰樣本的比例為2/3,于是可以得出圓形輸入實例應該為三角形
  • 當K = 5時,由于長方形樣本棧近鄰樣本比例為3/5,此時測試樣本被歸為長方形類別。

步驟:

  1. 計算測試數據與每個訓練數據之間的距離
  2. 按照距離的遞增關系進行排序
  3. 選取距離最小的k個點
  4. 確定前k個點所在類別的出現頻率
  5. 返回前k個點中出現頻率最高的類別做為測試數據的預測分類

優點:

  • 簡單,便于理解和實現
  • 應用范圍廣
  • 分類效果好
  • 無需進行參數估計

缺點:

  • 樣本小時誤差難以估計
  • 存儲所有樣本,需要較大存儲空間
  • 大樣本計算量大
  • k的取值對結果也有較大影響(k較小對噪聲敏感,k過大可能包含別的類樣本)

下一篇

未完待續

`

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/212688.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/212688.shtml
英文地址,請注明出處:http://en.pswp.cn/news/212688.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

辨析旅行商問題(TSP)與車輛路徑問題(VRP)

目錄 前言旅行商問題 (TSP)問題介紹數學模型符號定義問題輸入約束條件目標函數問題輸出 解的空間解空間大小計算解釋 車輛路徑問題 (VRP)問題介紹TSP到VRP的過渡數學模型符號定義問題輸入約束條件優化目標問題輸出 解空間特殊情況一般情況 TSP 與 VRP 對比 前言 計劃是通過本文…

基于JavaWeb+SSM+Vue助農扶貧微信小程序系統的設計和實現

基于JavaWebSSMVue助農扶貧微信小程序系統的設計和實現 源碼獲取入口Lun文目錄前言主要技術系統設計功能截圖 源碼獲取入口 Lun文目錄 目 錄 第一章 緒論 1 1.1 研究背景 1 1.2 研究意義 1 1.3 研究內容 2 第二章 開發環境與技術 3 2.1 JSP技術 3 2.2 MySQL數據庫 3 2.3 Java…

基于Solr的全文檢索系統的實現與應用

文章目錄 一、概念1、什么是Solr2、與Lucene的比較區別1)Lucene2)Solr 二、Solr的安裝與配置1、Solr的下載2、Solr的文件夾結構3、運行環境4、Solr整合tomcat1)Solr Home與SolrCore2)整合步驟 5、Solr管理后臺1)Dashbo…

4-Docker命令之docker commit

1.docker commit介紹 docker commit命令是用于根據docker容器的改變創建一個新的docker鏡像 2.docker commit用法 docker commit [參數] container [repository[:tag]] [rootcentos79 ~]# docker commit --helpUsage: docker commit [OPTIONS] CONTAINER [REPOSITORY[:TAG…

微服務學習:Nacos配置中心

先打開Nacos(詳見微服務學習:Nacos微服務架構中的服務注冊、服務發現和動態配置&Nacos下載) 1.環境隔離: 新建命名空間: 記住命名空間ID: c82496fb-237f-47f7-91ed-288a53a63324 再配置 就可達成環…

vue3 創建過程中 運行npm create vue@latest 和 npm install卡住不動的解決方法之一

問題:npm create vuelatest、和npm install 不管是電腦cmd上還是vscode終端上都是卡很久或不動! 解決: 1、查看npm代理 npm config get registry2、更換npm鏡像 npm config set registryhttps://registry.npmmirror.com這里換成淘寶源好像…

學習 Vue 3 源碼

Vue 3 是一款流行的前端框架,它的數據代理和虛擬 DOM 實現是其核心功能之一 Vue 3 的數據代理 在 Vue 3 中,數據代理是指將組件實例的屬性代理到其內部狀態對象上。這使得開發者可以使用更便捷的方式來訪問和修改組件的狀態。 Vue 3 的數據代理實現主…

docker-centos中基于keepalived+niginx模擬主從熱備完整過程

文章目錄 一、環境準備二、主機1、環境搭建1.1 鏡像拉取1.2 創建網橋1.3 啟動容器1.4 配置鏡像源1.5 下載工具包1.6 下載keepalived1.7 下載nginx 2、配置2.1 配置keepalived2.2 配置nginx2.2.1 查看nginx.conf2.2.2 修改index.html 3、啟動3.1 啟動nginx3.2 啟動keepalived 4、…

【HarmonyOS開發】控件開發過程中,知識點記錄

1、問題記錄及解決方案 1.1 資源(Icon&i18n)問題 控件:只有一個JS文件,不會將任何資源型文件(圖片、字體、默認文字等)打包到SO中。因此,當我們開發控件時,需要將需要使用到的資…

【機器學習】042_遷移學習

一、概述、定義 目的: 遷移學習的目的是將某個領域或任務上學習到的模式、知識應用到不同但相關的領域里,獲取更多數據,而不必投入許多時間人力來進行數據的標注。 舉例: 已經會下中國象棋,就可以類比著來學習國際…

Java單元測試:JUnit和Mockito的使用指南

引言: 在軟件開發過程中,單元測試是一項非常重要的工作。通過單元測試,我們可以驗證代碼的正確性、穩定性和可維護性,幫助我們提高代碼質量和開發效率。本文將介紹Java中兩個常用的單元測試框架:JUnit和Mockito&#x…

Navicat連接Oracle數據庫

Navicat連接Oracle數據庫 打開服務里面找到Oracle服務 OracleServerXE或者OracleServerTTL 創建數據庫連接 連接名默認自己起 主機選擇本地 端口默認 服務名在服務中可以找到輸入后綴 用戶名默認都是system 密碼是創建oracle時候填寫的口令 點擊測試連接即可

Spring Boot中的事務是如何實現的?懂嗎?

SpringBoot中的事務管理,用得好,能確保數據的一致性和完整性;用得不好,可能會給性能帶來不小的影響哦。 基本使用 在SpringBoot中,事務的使用非常簡潔。首先,得感謝Spring框架提供的Transactional注解&am…

【金融數據分析】計算滬深300指數行業權重分布并用餅圖展示

前言 前面的文章我們已經介紹了如何獲取滬深300成分股所述行業以及權重的數據,想要了解這部分內容的小伙伴可以閱讀上一篇文章 springbootjdbcTemplatesqlite編程示例——以滬深300成分股數據處理為例-CSDN博客 那么有了上文獲取的數據,我們實際上可以…

【rabbitMQ】rabbitMQ控制臺模擬收發消息

目錄 1.新建隊列 2.交換機綁定隊列 3.查看消息是否到達隊列 總結: 1.新建隊列 2.交換機綁定隊列 點擊amq.fonout 3.查看消息是否到達隊列 總結: 生產者(publisher)發送消息,先到達交換機,再到隊列&…

微信小程序uni-app:常用Form表單組件使用示例

目錄 input 輸入框picker 選擇器 input 輸入框 https://developers.weixin.qq.com/miniprogram/dev/component/input.htmlhttps://uniapp.dcloud.net.cn/component/input.html <inputclass"input-class"type"text"v-model"value"placeholde…

Linux下文本三劍客:grep、awk、sed之對比

一、grep 主要用于搜索某些字符串&#xff1b;sed、awk 用于處理文本&#xff1a; grep基本是以行為單位處理文本的&#xff1b; 而awk可以做更細分的處理&#xff0c;通過指定分隔符將一行&#xff08;一條記錄&#xff09;劃分為多個字段&#xff0c;以字段為單位處理文本。…

python輸出菱形字符圖案 附實戰代碼

下面是一個Python程序&#xff0c;可以用來輸出菱形字符圖案。這個程序使用了兩個嵌套的for循環&#xff0c;以及字符串連接操作。 # 獲取用戶輸入 n int(input("請輸入菱形的邊長&#xff1a;"))# 生成上半部分菱形 for i in range(1, n 1, 2):print(" &quo…

SDK,但未在應用內的隱私政策/在AppGallery Connect上提交的隱私政策內容中進行明示,不符合華為應用市場審核標準。

&#xff08;暫時用不到的也建議收藏一下&#xff0c;因為文章持續更新中&#xff09; 最新更改時間&#xff1a;20023-12-10 第三方SDK合集列表 為了確保用戶個人信息的安全&#xff0c;我們對使用到的第三方提供的軟件開發包&#xff08;SDK&#xff09;進行了嚴格的安全檢…

期末速成數據庫極簡版【存儲過程】(5)

目錄 【7】系統存儲過程 【8】用戶存儲過程——帶輸出參數的存儲過程 創建存儲過程 存儲過程調用 【9】用戶存儲過程——不帶輸出參數的存儲過程 【7】系統存儲過程 系統存儲我們就不做過程講解用戶存儲過程會考察一道大題&#xff0c;所以我們把重點放在用戶存儲過程。…