機器學習基礎概念

機器學習基礎概念

web/2025/9/7 16:15:05/文章來源:https://blog.csdn.net/m0_60444839/article/details/140137914

1.機器學習定義

2.機器學習工作流程

? ? ? ? （1）數據集

? ? ? ? ? ? ? ? ①一行數據：一個樣本

? ? ? ? ? ? ? ? ②一列數據：一個特征

? ? ? ? ? ? ? ? ③目標值（標簽值）：有些數據集有目標值，有些數據集沒有。因此數據類型由特征值+目標值構成或僅由特征值構成。

? ? ? ? （2）數據分割：機器學習的數據集一般劃分為訓練數據（用于構建模型）和測試數據（用于模型評估）兩個部分，劃分比例一般為7:3、4:1、3:1。

? ? ? ? （3）數據基本處理：對數據的缺失值、異常值進行處理

? ? ? ? （4）特征工程（Feature Engineering）：處理數據使特征在機器學習上更好發揮作用的過程

? ? ? ? ? ? ? ? 注：業界流傳，數據和特征決定機器學習的上限，而模型和算法只是逼近這個上限

? ? ? ? ? ? ? ? ①特征提取：將任意數據（如文本或圖像）轉為可用于機器學習的數字特征

? ? ? ? ? ? ? ? ②特征預處理：通過一些轉換函數將特征數據轉成更適合算法模型的特征數據

? ? ? ? ? ? ? ? ③特征降維：在某些限定條件下，降低隨機變量（特征）個數得到一組不相關的主變量

? ? ? ? （5）機器學習：選擇合適的算法對模型進行訓練

? ? ? ? （6）模型評估：對訓練好的模型進行評估

3.機器學習算法分類（根據數據集組成不同進行劃分）

? ? ? ? （1）監督學習：輸入數據由特征值和目標值組成，函數的輸出（目標值）可以是一個連續的值（回歸）或是有限個離散值（分類）

? ? ? ? ? ? ? ? ①回歸問題：預測房價，根據樣本集擬合出一條連續曲線

? ? ? ? ? ? ? ? ②分類問題：根據腫瘤特征預測是良性還是惡性

? ? ? ? （2）無監督學習：輸入數據由特征值組成，輸入的數據沒有被標記也沒有確定結果，樣本數據類別未知，需根據樣本間的相似性對樣本集進行類別劃分

? ? ? ? （3）半監督學習：訓練集同時包含有標記（有目標值）數據和未標記（沒有目標值）數據

? ? ? ? （4）強化學習：實質是做決策問題，即自動進行決策，并且可以做連續決策，強化學習的目標就是獲得最多的累計獎勵

4.模型評估

? ? ? ? （1）分類模型評估：準確率（預測正確的數占樣本總數的比例）、精確率、召回率、F1-score、AUC指標

? ? ? ? （2）回歸模型評估：均方根誤差RMSE（p_i為預測值，a_i為實際值）、相對平方誤差RSE、平均絕對誤差MAE、相對絕對誤差RAE

? ? ? ? （3）模型表現效果：過擬合（所建的機器學習模型在訓練樣本中表現得過于優越，導致在測試數據集中表現不佳）、欠擬合（模型學習太粗糙，連訓練集中樣本數據的特征關系都沒有學出來）

5.深度學習：也稱深度結構學習、層次學習、深度機器學習，是一類算法集合，是機器學習的一個分支，在會話識別、圖像識別和對象偵測等領域表現出驚人的準確性。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/38893.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/38893.shtml
英文地址，請注明出處：http://en.pswp.cn/web/38893.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Java實現圖書管理系統

Java實現圖書管理系統

一、框架 1. 創建類用戶：管理員AdminUser 普通用戶NormalUser 繼承抽象類User 書：書Book 書架BookList 操作對象：書Book 2. 知識點主要涉及的知識點：數據類型變量 if for 數組方法類和對象封裝繼承多態抽象類和接口 …

閱讀更多...

Linux運維之需掌握的基本Linux命令

Linux運維之需掌握的基本Linux命令

前言：本博客僅作記錄學習使用，部分圖片出自網絡，如有侵犯您的權益，請聯系刪除目錄一、SHELL 二、執行命令三、常用系統工作命令四、系統狀態檢測命令五、查找定位文件命令六、文本文件編輯命令七、文件目錄管理命令…

閱讀更多...

【JavaWeb】登錄校驗-會話技術（一）Cookie與Session

【JavaWeb】登錄校驗-會話技術（一）Cookie與Session

登錄校驗實現登陸后才能訪問后端系統頁面，不登陸則跳轉登陸頁面進行登陸。首先我們在宏觀上先有一個認知： HTTP協議是無狀態協議。即每一次請求都是獨立的，下一次請求并不會攜帶上一次請求的數據。因此當我們通過瀏覽器訪問登錄后&#…

閱讀更多...

go語言怎么獲取文件的大小并且轉化為kb為單位呢？

go語言怎么獲取文件的大小并且轉化為kb為單位呢？

在Go語言中，你可以使用os包中的IsExist和Stat函數來獲取文件的信息，包括文件的大小。文件的大小通常是以字節為單位的，但你可以很容易地將其轉換為KB（千字節）。下面是一個簡單的Go程序示例，該程序打開指定…

閱讀更多...

Simulink 模型生成 C 代碼（一）：使用 Embedded Coder 快速向導生成代碼

Simulink 模型生成 C 代碼（一）：使用 Embedded Coder 快速向導生成代碼

以matlab自帶的示例模型RollAxisAutopilot為例進行講解。RollAxisAutopilot為飛機自動駕駛控制系統模型。使用快速向導工具生成代碼通過鍵入以下命令打開模型 RollAxisAutopilot： openExample(RollAxisAutopilot); 如果 C 代碼選項卡尚未打開，請在 …

閱讀更多...

【C++】宏定義

【C++】宏定義

嚴格來說，這個題目起名為C是不合適的，因為宏定義是C語言的遺留特性。CleanCode并不推薦C中使用宏定義。我當時還在公司做過宏定義為什么應該被取代的報告。但是適當使用宏定義對代碼是有好處的。壞處也有一些。無參宏定義最常見的一種宏定義&#xf…

閱讀更多...

makefile總結

makefile總結

1，Makefile規則介紹一個簡單的 Makefile 描述規則組成： TARGET... : PREREQUISITES... COMMAND 注意：每一個命令行必須以[Tab]字符開始， [Tab]字符告訴 make 此行是一個命令行。 make 按照命令完成相應的動作。這也是書寫 Makefile 中容易產生，而且比較隱蔽的錯…

閱讀更多...

油煙凈化器：餐飲業健康環保的守護者

油煙凈化器：餐飲業健康環保的守護者

我最近分析了餐飲市場的油煙凈化器等產品報告，解決了餐飲業廚房油膩的難題，更加方便了在餐飲業和商業場所有需求的小伙伴們。在現代餐飲業，油煙凈化器已經成為不可或缺的重要設備。它不僅是保障餐飲環境清潔的利器，更是守護健康…

閱讀更多...

新聲創新20年：無線技術給助聽器插上“娛樂”的翅膀

新聲創新20年：無線技術給助聽器插上“娛樂”的翅膀

聽力損失并非現代人的專利，古代人也會有聽力損失。助聽器距今發展已經有二百多年了，從當初單純的聲音放大器到如今的全數字時代助聽器，助聽器發生了翻天覆地的變化，現代助聽器除了助聽功能，還具有看電視，聽…

閱讀更多...

【LeetCode】368. 最大整除子集

【LeetCode】368. 最大整除子集

雖然這題挺難寫的，但是仍然提醒了我：解題要注意方法。在明確分析當一條道路走不通的時候，就不要再猶豫了，就要果斷的換方法，嘗試用其它方法解決。否則一味的消耗時間，得不償失。換方法的前提是明確的分析&a…

閱讀更多...

C++ 和C#的差別

C++ 和C#的差別

首先把眼睛瞪大，然后憋住一口氣，讀下去： 1、CPP 就是C plus plus的縮寫，中國大陸的程序員圈子中通常被讀做"C加加"，而西方的程序員通常讀做"C plus plus"，它是一種使用非常廣泛的計算…

閱讀更多...

Maya崩潰閃退常見原因及解決方案

Maya崩潰閃退常見原因及解決方案

Autodesk Maya 是一款功能強大的 3D 計算機圖形程序，被電影、游戲和建筑等各個領域的設計師廣泛使用。然而，Maya 就像任何其他軟件一樣可能會發生崩潰問題。在前文中，小編給大家介紹了3ds Max使用V-Ray渲染時的崩潰閃退解決方案： …

閱讀更多...

Neo4j 圖數據庫高級操作

Neo4j 圖數據庫高級操作

Neo4j 圖數據庫高級操作文章目錄 Neo4j 圖數據庫高級操作1 批量添加節點、關系1.1 直接使用 UNWIND 批量創建關系1.2 使用 CSV 文件批量創建關系1.3 選擇方法 2 索引2.1 創建單一屬性索引2.2 創建組合屬性索引2.3 創建全文索引2.4 列出所有索引2.5 刪除索引2.6 注意事項 3 清…

閱讀更多...

后端之路第三站(Mybatis)——JDBC跟Mybatis、lombok

后端之路第三站(Mybatis)——JDBC跟Mybatis、lombok

一、什么是JDBC JDBC就是sun公司研發的一套通過java來操控數據庫的工具，對應不同的數據庫系統有不同的JDBC，而他們統稱【驅動】，這就是上一篇我們提到創建Mybatis項目時要引入的依賴、以及連接數據庫四要素里的第一要素。 JDBC有自己一套原始…

閱讀更多...

SerialportToTCP② 全

SerialportToTCP② 全

效果補全（代碼）： namespace SerialportToTCP {public partial class Form1 : Form{IniHelper Ini;string[] botelvs new string[] { "1200", "4800", "9600", "13200" };public Form1(){Initializ…

閱讀更多...

Elasticsearch：Painless scripting 語言（一）

Elasticsearch：Painless scripting 語言（一）

Painless 是一種高性能、安全的腳本語言，專為 Elasticsearch 設計。你可以使用 Painless 在 Elasticsearch 支持腳本的任何地方安全地編寫內聯和存儲腳本。 Painless 提供眾多功能，這些功能圍繞以下核心原則： 安全性：確保集群的…

閱讀更多...

安卓gdb 建立鏈接

安卓gdb 建立鏈接

adbshell gdbserver :1234 testdcam --sensor 0 --workmode 0 --args preview-size1024x600,picture-size640x480, --time 10 adb forwardtcp:1234 tcp:1234 //設置adb的轉發 ./prebuilts/gcc/linux-x86/arm/arm-linux-androideabi-4.7/bin/arm-linux-androideabi-gdb out/tar…

閱讀更多...

近紅外光譜腦功能成像(fNIRS):1.光學原理、變量選取與預處理

近紅外光譜腦功能成像(fNIRS):1.光學原理、變量選取與預處理

一、朗伯-比爾定律與修正的朗伯-比爾定律朗伯-比爾定律是一個描述光通過溶液時被吸收的規律。想象你有一杯有色液體，比如一杯紅茶。當你用一束光照射這杯液體時，光的一部分會被液體吸收，導致透過液體的光變弱。朗伯-比爾定律告訴我們&#…

閱讀更多...

mmdetection3D指定版本安裝指南

mmdetection3D指定版本安裝指南

1. 下載指定版本號選擇指定版本號下載mmdetection3d的源碼，如這里選擇的是0.17.2版本 git clone https://github.com/open-mmlab/mmdetection3d.git -b v0.17.22. 安裝 cd mmdetection3d安裝依賴庫 pip install -r requirment.txt編譯安裝 pip install -v e .…

閱讀更多...

redis主從復制哨兵模式集群管理

redis主從復制哨兵模式集群管理

主從復制： 主從復制是高可用Redis的基礎，哨兵和集群都是在主從復制基礎上實現高可用的。主從復制主要實現了數據的多機備份，以及對于讀操作的負載均衡和簡單的故障恢復。缺陷：故障恢復無法自動化；寫操作無法負載均衡&…

閱讀更多...

最新文章