8.14 機器學習（1）

8.14 機器學習（1）

pingmian/2025/8/16 22:36:27/文章來源:https://blog.csdn.net/2301_82188844/article/details/150389430

機器學習基礎

一、什么是機器學習

定義：讓計算機利用大量數據在特定任務上持續改進性能的過程，可以讓任務完成的更好。

機器學習的領域很多。

二、機器學習基本術語

數據集、樣本、特征（屬性）、屬性空間、向量表示、訓練集（訓練模型的數據集合，含標記信息）、測試集（測試模型的數據集合）

三、主要學習任務（以好瓜壞瓜為例子）

監督學習：已知正確答案和參數，達到要求的學習過程。
- 分類：輸出的結果位有限，離散型（好瓜/壞瓜）。
- 回歸：輸出某個范圍內任何數值，連續型（房價預測）。
無監督學習：提供數據集合，不提供有信息的學習過程。
- 聚類：把樣本按相似度分組。
- 關聯分析：尿布 → 葡萄酒推薦。
集成學習
①結合多個弱學習器提升整體性能。

四、模型評估與選擇

誤差
1. 訓練誤差（經驗誤差）：在訓練集上的誤差。
2. 泛化誤差：在新樣本上的期望誤差。
3. 錯誤率：錯誤的樣本占樣本總數的比例。
4. 殘差：實際預測輸出與樣本真實輸出的差異。
擬合狀態
1. 欠擬合：模型太簡單，訓練誤差高。
  → 解決：增加特征、提高模型復雜度、減小正則化。
2. 過擬合：模型太復雜，訓練誤差低但泛化誤差高。
  → 解決：增數據、降維、正則化、集成學習。
3. 損失函數：衡量模型預測誤差大小的函數。（損失函數越小越好）
評估方法
1. 留出法：70 % 訓練 / 30 % 測試，分層采樣。
2. k 折交叉驗證：常用 10 折，取 k 次平均。
性能指標（二分類）
1. TP, FP, TN, FN
2. 查準率 P = TP / (TP+FP)
3. 查全率 R = TP / (TP+FN)

五、選擇模型的原則

奧卡姆剃刀：在可解釋數據的前提下選最簡單模型。

沒有免費午餐（NFL）：脫離具體任務談算法優劣無意義。

機器學習=數據+算法+評估

用經驗提升任務性能，警惕欠擬合與過擬合，通過交叉驗證和性能指標選擇最適合實際問題的簡潔模型。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/93213.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/93213.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/93213.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

給電腦升級內存，自檢太慢，以為出錯

給電腦升級內存，自檢太慢，以為出錯

公司電腦是16G內存，用虛擬機時非常吃力。于是跟領導說，買了32G內存和1T SSD。電腦有兩個SATA數據線，SATA電源頭只有一個。于是買了幾個1轉2，順利接上。把原來的16G拔下，換上32G內存。結果開機沒反應。心里就有點嘀咕&a…

閱讀更多...

Effective C++ 條款43：學習處理模板化基類內的名稱

Effective C++ 條款43：學習處理模板化基類內的名稱

Effective C 條款43：學習處理模板化基類內的名稱核心思想：模板化基類（templatized base classes）中的名稱在派生類模板中默認不可見，需要通過this->前綴、using聲明或顯式基類限定來引入。這是因為編譯器在解析模板…

閱讀更多...

Mybatis簡單練習注解sql和配置文件sql+注解形式加載+配置文件加載

Mybatis簡單練習注解sql和配置文件sql+注解形式加載+配置文件加載

項目結構 d:\test\runjar\data\static\data\mybatis_helloworld\Mybatis\ ├── lib\ │ ├── asm-3.3.1.jar │ ├── c3p0-0.9.1.2.jar │ ├── cglib-2.2.2.jar │ ├── commons-logging-1.1.1.jar │ ├── ehcache-core-2.6.8.jar │ ├── javassi…

閱讀更多...

抗日勝利80周年 | HTML頁面

抗日勝利80周年 | HTML頁面

飛翔的和平鴿；屹立的人民英雄紀念碑；倒下的日本國旗；旋轉的金色勛章無不代表著我們勝利了！！！HTML源代碼： <!DOCTYPE html> <html lang"zh-CN"> <head><meta cha…

閱讀更多...

web仿寫網站

web仿寫網站

一、完成自己學習的官網，至少三個不同的頁面。1、界面1（1）代碼<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-wid…

閱讀更多...

基于element-plus和IndexedDB數據庫的基礎表單

基于element-plus和IndexedDB數據庫的基礎表單

本文介紹了基于Vue 3和Element Plus的表單項目配置頁面實現。頁面包含搜索欄、操作按鈕、數據表格和分頁組件，使用IndexedDB進行本地數據存儲。主要功能包括：1) 通過模糊查詢搜索項目；2) 分頁顯示項目數據；3) 添加/編輯/刪除項目操…

閱讀更多...

paimon實時數據湖教程-主鍵表更新機制

paimon實時數據湖教程-主鍵表更新機制

在上一章，我們學習了 Paimon 如何保證每一次寫入的原子性和一致性。但數據倉庫的核心需求不僅是寫入，更重要的是更新。想象一個場景：我們需要實時更新用戶的最新信息，或者實時累加計算用戶的消費總額。傳統的 Hive 數據湖對此無能…

閱讀更多...

第十六屆藍橋杯青少組C++省賽[2025.8.9]第二部分編程題（4、矩陣圈層交錯旋轉）

第十六屆藍橋杯青少組C++省賽[2025.8.9]第二部分編程題（4、矩陣圈層交錯旋轉）

參考程序：#include <bits/stdc.h> using namespace std;const int MAXN 105; int a[MAXN][MAXN];int main() {int n;if (!(cin >> n)) return 0;for (int i 0; i < n; i)for (int j 0; j < n; j)cin >> a[i][j];int layers n / 2; // 每…

閱讀更多...

【FastGTP?】[01] 使用 FastGPT 搭建簡易 AI 應用

【FastGTP?】[01] 使用 FastGPT 搭建簡易 AI 應用

簡易應用：英語單詞解釋例句 1. 前言 FastGPT 是一個低代碼 AI 應用構建平臺，可以通過簡單配置快速創建自己的 AI 應用。本文將帶你用 FastGPT 搭建一個英語單詞解釋例句的 AI 工具，輸入英文單詞后，輸出： 單詞…

閱讀更多...

【Mysql語句練習】

【Mysql語句練習】

MysqlMysql語句練習一、建庫建表二、插入數據三、查詢Mysql語句練習一、建庫建表 1、創建數據庫mydb11_stu，并使用數據庫 # 創建數據庫mydb11_stu mysql> create database mydb11_stu; Query OK, 1 row affected (0.00 sec) # 使用數據庫 mysql> use mydb1…

閱讀更多...

用Python Scrapy征服網絡爬蟲（反爬技術深入剖析）

用Python Scrapy征服網絡爬蟲（反爬技術深入剖析）

目錄第1章：Scrapy是個啥？為什么它是你爬蟲路上的最佳拍檔？ 1.1 Scrapy的核心亮點 1.2 啥時候用Scrapy？ 1.3 安裝Scrapy 第2章：動手寫你的第一個Scrapy爬蟲 2.1 創建Scrapy項目 2.2 定義數據結構（Items） 2.3 編寫爬蟲邏輯 2.4 運行爬蟲 2.5 小技巧：調試爬蟲 …

閱讀更多...

解決Electron透明窗口點擊不影響其他應用

解決Electron透明窗口點擊不影響其他應用

遇到的問題：在electron透明窗口點擊，影響窗口下的應用接受不到點擊事件解決方案：CSSIgnoreMouseEvents實現原理：主進程默認設置禁用目標窗口鼠標事件（禁用之后能檢測到mousemove），UI進程檢測頁面…

閱讀更多...

C# 泛型（Generics）詳解

C# 泛型（Generics）詳解

泛型是 C# 2.0 引入的核心特性，它允許在定義類、接口、方法、委托等時使用未指定的類型參數，在使用時再指定具體類型。這種機制可以顯著提高代碼的復用性、類型安全性和性能。一、泛型的核心概念類型參數化泛型允許將類型作為 "參數" 傳遞給類…

閱讀更多...

Spring中存在兩個相同的Bean是否會報錯？

Spring中存在兩個相同的Bean是否會報錯？

第一種情況：使用XML的方式設置Bean，這種情況在Spring啟動時就會報錯，因為ID在Spring中是Bean的唯一標識，Spring容器在啟動時會校驗唯一性，一旦發現重復就會報錯。但是如果是在兩個不同的XML文件中定義兩個相同的Bean&a…

閱讀更多...

【新手入門】Android基礎知識（一）：系統架構

【新手入門】Android基礎知識（一）：系統架構

目錄 Android 系統架構圖 1. 應用 2. JAVA API 框架 3. 原生 C/C 庫 4. Android 運行時（Android Runtime） 5. 硬件抽象層 (HAL) 6. Linux 內核參考資料 Android 系統架構圖 Android底層內核空間以Linux Kernel作為基石，上層用戶空…

閱讀更多...

晶振電路的負載電容、電阻參數設計

晶振電路的負載電容、電阻參數設計

系列文章目錄文章目錄系列文章目錄前言一、晶振主要參數二、有源與無源區別三、無源晶振四、有源晶振總結前言在硬件電路的設計中，晶振電路是必不可少的，它充當了整個電路心臟的作用。在這個晶振電路的設計中負載電容、電阻參數的選型是很重要的&…

閱讀更多...

電腦上練打字用什么軟件最好：10款打字軟件評測

電腦上練打字用什么軟件最好：10款打字軟件評測

現在孩子們在電腦上練打字，軟件一搜一大把，可好多家長和老師都犯愁：到底哪個管用？我帶200多個小學生練過字，前前后后試了十款軟件，今天就掏心窩子說說——有的看著花哨其實沒用，有的專業是專業但…

閱讀更多...

第五天～提取Arxml的模板信息

第五天～提取Arxml的模板信息

?? ARXML模板信息提取：解鎖汽車軟件的樂高魔法在汽車電子的世界里，AUTOSAR（汽車開放系統架構）如同無形的神經系統，而ARXML文件正是承載這套神經系統藍圖的數字載體。當工程師們需要批量創建或修改ECU（電子控制單元）配置時，模板信息提取便成為了一項至關重要的核心技…

閱讀更多...

react+antd+vite自動引入組件、圖標等

react+antd+vite自動引入組件、圖標等

前言：react在使用antd的時候，也是需要每個組件都在界面上按需引入的，那能不能自動生成，按需使用呢？我們這里說一說這個。安裝插件，組件按需引入unplugin-antd-resolverunplugin-auto-importnpm install unp…

閱讀更多...

深度學習與遙感入門（六）｜輕量化 MobileNetV2 高光譜分類

深度學習與遙感入門（六）｜輕量化 MobileNetV2 高光譜分類

系列回顧： （一）CNN 基礎：高光譜圖像分類可視化全流程 （二）HybridNet（CNNTransformer）：提升全局感受野 （三）GCN 入門實戰：基于光譜 KNN…

閱讀更多...

最新文章