機器學習簡單概述

Chatgpt回答

  • 機器學習:機器學習是人工智能的一個分支,側重于通過數據訓練模型,使計算機能夠根據數據進行預測、分類、回歸等任務。它通過算法從歷史數據中學習規律,然后在新數據上進行推斷。機器學習包括多種算法,如**線性回歸、決策樹、支持向量機(SVM)、K最近鄰(KNN)**等。
  • 深度學習:深度學習是機器學習的一個子集,它基于人工神經網絡(特別是深層神經網絡)來模擬人類大腦的學習方式。深度學習能夠處理復雜的數據結構(如圖像、語音、文本等),并能夠自動從原始數據中提取特征,而不需要人工特征工程。

1.統計學習方法概論

監督學習:告訴它哪些東西是好的,哪些東西是壞的,依據這些來學習。
實現步驟:1.得到一個有限的訓練數據集合;2.確定模型的假設空間,也就是所有的備選模型;3.確定模型選擇的準則,即學習策略;4.實現求解最優模型的算法;5.通過學習方法選擇最優模型;6.利用學習的最優模型對新數據進行預測或分析

數據集的劃分

  • 訓練集:模型的訓練
  • 測試集:模型的選擇
  • 驗證集:模型的評估
  1. 統計學習路線:設計模型->訓練->預測
  2. 監督學習與非監督學習的聯系與區別
  3. 統計學習三要素:模型、策略、算法
  4. 模型的評估:訓練誤差、驗證誤差、測試誤差
  5. 正則化與交叉嚴重
  6. 泛化能力:泛化誤差上界
  7. 生成模型與判別模型的聯想與區別
  8. 分類問題:準確率、精確率、召回率、F1值
  9. 標準問題
  10. 回歸問題:輸出為連續的值

2.感知機——入門的墊腳石

超平面

  1. 感知機通過構造超平面的形式劃分不同類的點。
  2. 感知機屬于線性判別模型,因為它的判別邊界是線性的。
  3. 函數間隔和幾何間隔的區別

3.K近鄰——物以類聚

  1. K近鄰的思想:物以類聚
  2. K近鄰沒有顯式的訓練過場
  3. 距離度量:歐式距離、曼哈頓距離、切比雪夫距離
    • 歐式距離:兩點之間直線
    • 曼哈頓距離:城市街區距離
    • 切比雪夫距離:棋盤距離
  4. 分類方式:多數表決規則

歐式距離、曼哈頓距離、切比雪夫距離

4.樸素貝葉斯

條件概率公式:
P ( A ∣ B ) = P ( A B ) P ( B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{P(B \mid A) P(A)}{P(B)} P(AB)=P(B)P(AB)?=P(B)P(BA)P(A)?
表示已發生事件B的情況下,事件A發生的概率。

5.決策樹——每次選一邊

信息熵:在信息論與概率統計中,熵(entropy)是表示隨機變量不確定性的度量。
熵越大,則隨機變量的不確定性越大。

信息增益:表示得知特征X的信息而使得類Y的信息的不確定性減少的程度。
信息增益算法
輸入:訓練數據集D和特征A
輸出:特征A對訓練數據集D的信息
信息增益比:
如果以信息增益為劃分依據,存在偏向選擇取值較多的特征,信息增益是對這一問題進行矯正。

  1. 決策樹的核心思想:以樹結構為基礎,每個節點對某特征進行判斷,進入分支,直到到達葉節點。
  2. 決策樹構造的核心思想:讓信息熵快速下降,從而達到最少的判斷次數獲得標簽。
  3. 判斷信息熵下降速度的方法:信息增益。
  4. 構建決策樹算法:ID3(使用信息增益)、C4.5(使用使用信息增益比)。
  5. 信息增益會導致節點偏向選取取值角度的特征的問題。

6.邏輯斯蒂回歸于最大熵

  1. 邏輯斯蒂以輸出概率的形式解決了極小距離帶來的+1和-1的天壤之別,同時概率也可作為模型輸出的置信程度。
  2. 邏輯斯蒂使得了最終的模型函數連續可微,訓練目標與預測目標達成一致。
  3. 邏輯斯蒂采用了較大似然估計來估計參數。

最大熵:趨向于均勻分布,即可最大

7.支持向量機——升維打擊

Support vector machines (SVM)

這里提到了最優超平面,在感知機里面,我們說的是超平面,現在通過SVM升維,存在最優超平面,就不是線性的了。

升維一定會線性可分?會不會升到無窮維了仍然線性不可分?
答案是不會的,首先要明白,我們的數據集一定是基于真實的某種分布,分為A類的樣本和B類的一定在本質上有區別。只要有區別,就一定可以區分開來,一定在某個高維度上線性可分。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/79389.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/79389.shtml
英文地址,請注明出處:http://en.pswp.cn/web/79389.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

openjdk底層匯編指令調用(一)——匯編指令及指令編碼基礎

匯編指令 計算機在執行過程時只識別代表0或者1的電信號。因此為了讓計算機能夠執行則須向計算機輸入一系列01構成的指令。 例如在x64平臺下,0x53,二進制為01010011,表示將rbx寄存器中的值壓棧。 但是,對于程序員而言,…

Python Day 22 學習

學習講義Day14安排的內容:SHAP圖的繪制 SHAP模型的基本概念 參考學習的帖子:SHAP 可視化解釋機器學習模型簡介_shap圖-CSDN博客 以下為學習該篇帖子的理解記錄: Q. 什么是SHAP模型?它與機器學習模型的區別在哪兒? …

48.輻射發射RE和傳導發射CE測試方法分析

輻射發射RE和傳導發射CE測試方法分析 1. 所有測試項目總結2. 輻射發射RE測試方法3. 傳到發射CE測試方法 1. 所有測試項目總結 所有EMC測試項目都是基于模擬現實的。 模擬現實中可能發生的各種真實場景,然后統計總結出各種場景下的真實應力,并通過制造測…

在 Vue 3 中實現刮刮樂抽獎

🎉 在 Vue 3 中實現刮刮樂抽獎 當項目中需要做一些活動互動頁時,需要實現刮刮樂,請看如下效果: 這里感謝github用戶Choicc分享的組件,具體可點擊傳送門查看 1. 引入組件 將/src/components下ScratchCard.vue復制到自…

c語言第一個小游戲:貪吃蛇小游戲01

hello啊大家好 今天我們用一個小游戲來增強我們的c語言! 那就是貪吃蛇 為什么要做一個貪吃蛇小游戲呢? 因為這個小游戲所涉及到的知識有c語言的指針、數組、鏈表、函數等等可以讓我們通過這個游戲來鞏固c語言,進一步認識c語言。 一.我們先…

實戰項目1(02)

目錄 任務場景一 【sw1和sw2的配置如下】 任務場景二 【sw3的配置】 【sw4-6的配置】 任務場景一 某公司有生產、銷售、研發、人事、財務等多個部門,這些部門分別連接在兩臺交換機(SW1和SW2)上,現要求給每個部門劃分相應的V…

Kubernetes生產實戰(十四):Secret高級使用模式與安全實踐指南

一、Secret核心類型解析 類型使用場景自動管理機制典型字段Opaque (默認)自定義敏感數據需手動創建data字段存儲鍵值對kubernetes.io/dockerconfigjson私有鏡像倉庫認證kubelet自動更新.dockerconfigjsonkubernetes.io/tlsTLS證書管理Cert-Manager可自動化tls.crt/tls.keykube…

Linux: 信號【阻塞和捕捉信號】

Linux: 信號【阻塞和捕捉信號】 (一)阻塞信號1.信號其他相關的概念2.在內核中表示3.sigset_t4.信號集操作函數5.sigprocmask(設置阻塞)6.sigpending(得到未決狀態) (二)捕…

MySQL 數據庫集群部署、性能優化及高可用架構設計

MySQL 數據庫集群部署、性能優化及高可用架構設計 集群部署方案 1. 主從復制架構 傳統主從復制:配置一個主庫(Master)和多個從庫(Slave)GTID復制:基于全局事務標識符的復制,簡化故障轉移半同步復制:確保至少一個從庫接收到數據…

Java 多態:原理與實例深度剖析

一、多態概述 在 Java 面向對象編程體系中,多態是構建靈活、可擴展程序的核心機制之一,與封裝、繼承并稱為面向對象的三大特性。其本質是同一操作作用于不同對象,產生不同的執行結果,這使得程序在運行時能根據實際對象類型動態調…

解決使用寶塔Linux部署前后端分離項目遇到的問題

問題一:訪問域名轉圈圈,顯示404,403 沒有解決跨域問題,在后端yml中設置content:/prod(生產環境),在前端.env文件中將http://127.0.0.1:8080/替換為公網IP,并在vite.conf…

《Python星球日記》 第54天:卷積神經網絡進階

名人說:路漫漫其修遠兮,吾將上下而求索。—— 屈原《離騷》 創作者:Code_流蘇(CSDN)(一個喜歡古詩詞和編程的Coder😊) 目錄 一、深度CNN架構解析1. LeNet-5(1998)2. AlexNet&#x…

旅游設備生產企業的痛點 質檢系統在旅游設備生產企業的應用

在旅游設備制造行業,產品質量直接關系到用戶體驗與企業口碑。從景區纜車、觀光車到水上娛樂設施,每一件設備的安全性與可靠性都需經過嚴苛檢測。然而,傳統質檢模式常面臨數據分散、流程不透明、合規風險高等痛點,難以滿足旅游設備…

MySql(進階)

一.數據庫約束 約束類型 NOT NULL - 指示某列不能存儲 NULL 值。 (not null不能為NILL) UNIQUE - 保證某列的每行必須有唯一的值。 (unique唯一值) DEFAULT - 規定沒有給列賦值時的默認值。 (default為空給定默認值) PRIMARY…

Three.js + React 實戰系列 - 聯系方式提交表單區域 Contact 組件?(表單綁定 + 表單驗證)

對個人主頁設計和實現感興趣的朋友可以訂閱我的專欄哦!!謝謝大家!!! 在現代網頁中,一個精致的 Contact 區域不僅僅是表單的堆砌,更是用戶與我們建立聯系的第一印象。 在本節課中,我…

UOJ 164【清華集訓2015】V Solution

Description 給定序列 a ( a 1 , a 2 , ? , a n ) a(a_1,a_2,\cdots,a_n) a(a1?,a2?,?,an?),另有序列 h h h,初始時 h a ha ha. 有 m m m 個操作分五種: add ? ( l , r , v ) \operatorname{add}(l,r,v) add(l,r,v):…

C++開發過程中的注意事項詳解

目錄 C++開發過程中的注意事項詳解 一、內存管理:避免泄漏與資源浪費 1.1 使用智能指針管理動態內存 1.2 避免手動內存管理的陷阱 1.3 利用RAII機制管理資源 1.4 容器與內存分配 二、安全性:防御攻擊與未定義行為 2.1 輸入驗證與安全編碼 2.2 使用安全的通信協議 2…

Git 時光機:修改Commit信息

前言 列位看官都知道,Git 的每一次 git commit,其中會包含作者(Author)和提交者(Committer)的姓名與郵箱。有時可能會因為配置錯誤、切換了開發環境,或者只是單純的手滑,導致 commi…

QSFP+、QSFP28、QSFP-DD接口分別實現40G、100G、200G/400G以太網接口

常用的光模塊結構形式: 1)QSFP等效于4個SFP,支持410Gbit/s通道傳輸,可通過4個通道實現40Gbps傳輸速率。與SFP相比,QSFP光模塊的傳輸速率可達SFP光模塊的四倍,在部署40G網絡時可直接使用QSFP光模塊&#xf…

好用的播放器推薦

以下是一些好用的播放器推薦,按照不同平臺和使用場景分類: 電腦端 VLC Media Player 特點:開源、跨平臺,支持幾乎所有的音視頻格式,無需額外安裝解碼器。具備強大的功能,如播放列表管理、視頻和音頻濾鏡、…