機器學習的工作流程

🌟 歡迎來到AI奇妙世界! 🌟

親愛的開發者朋友們,大家好!👋

我是人工智能領域的探索者與分享者,很高興在CSDN與你們相遇!🎉 在這里,我將持續輸出AI前沿技術、實戰案例、算法解析等內容,希望能和大家一起學習、交流、成長!💡

🔥 為什么關注AI?

人工智能正在重塑世界!🌍

🚀 深度學習讓機器擁有“視覺”“聽覺”
🤖 **大模型(如GPT、文心一言)**改變人機交互方式
📊 數據科學賦能商業決策
🏥 AI醫療助力精準診斷
🛒 智能推薦優化用戶體驗
無論你是AI新手👶,還是資深極客👨💻,這里都有適合你的內容!

📌 你將在這里看到什么?

? AI基礎入門(Python、TensorFlow/PyTorch)
? 實戰項目(圖像識別、NLP、推薦系統)
? 論文解讀(CVPR、NeurIPS最新研究)
? 行業動態(AI政策、大模型進展)
? 避坑指南(訓練技巧、調參經驗)

💬 期待與你互動!

📢 評論區隨時交流,歡迎提問!
💌 私信開放,一起探討技術難題!
🤝 關注我,AI學習路上不迷路!

最后,送上一句AI圈的經典名言:

“人工智能不會取代人類,但會用AI的人會取代不用AI的人。”

讓我們一起擁抱AI時代,用代碼改變未來!🚀

點擊關注👉,開啟AI之旅! 🔥🔥🔥

目錄

一.什么是機器學習

二.機器學習的工作流程

三.解釋上述流程的各步驟

1.獲取數據

①獲取到的數據種類

②數據中的名詞

③數據類型的構成

④數據分割

2.數據基本處理

3.特征工程

①什么是特征工程?

②為什么需要特征工程?

③特征工程包含的內容(了解)

特征提取

特征預處理

特征降維

4.機器學習(模型訓練)

5.模型評估

小結


一.什么是機器學習

機器學習是從數據自動分析獲得模型,并利用模型對未知數據進行預測。

?簡單來說,計算機通過對新的數據進行分析,獲得一個模型,通過這個模型,計算機就可以預測未知屬性

二.機器學習的工作流程

機器學習工作流程總結:?

  1. 獲取數據
  2. 數據基本處理
  3. 特征工程
  4. 機器學習(模型訓練)
  5. 模型評估:①結果達到要求,則上線服務 / ②結果沒達到要求,則重復上面的步驟

三.解釋上述流程的各步驟

1.獲取數據

①獲取到的數據種類

  • 房屋價格:可能是小數,如105.5萬

  • 電影數據:動作片/喜劇片等等

  • 人物分類:可以按是否戴帽子 / 手里是否拿東西等等,來進行分類,沒有對錯之分,只是分類角度不同

②數據中的名詞

在數據集中一般:

  • 一行數據我們稱為一個樣本

  • 一列數據我們稱為一個特征

  • 需要我們判斷的列(如上圖的電影類型),我們稱為目標值
  • 有些數據有目標值,有些數據沒有目標值

如下圖,有的行就沒有電影類型,有的就有。

③數據類型的構成

  • 數據類型一:特征值+目標值(目標值是連續的和離散的)
  • 數據類型二:只有特征值,沒有目標值

④數據分割

  • 機器學習一般的數據集會分成兩部分
    • 訓練數據:用于訓練,構建模型
    • 測試數據:在模型檢驗時使用,用于評估模型是否有效
  • 劃分比例:
    • 訓練集:70% ~ 80%
    • 測試集:30% ~ 20%

2.數據基本處理

????????對數據進行缺失值、去除異常值等處理。

????????舉例:比如我們讓一群人填寫問卷調查,肯定有人會有部分項不填寫(缺失值),或者年齡填寫1000歲(異常值),這兩種情況就需要進行處理。

3.特征工程

①什么是特征工程?

????????特征工程是使用專業背景知識和技巧,對數據進行處理,使得特征能在機器學習算法上發揮更好的作用

? ? ? ? 意義:會直接影響機器學習的效果。

????????簡單理解就是,進一步對數據進行處理。

????????因為工程一般都很重要(比如蓋樓工程),所以就表示提取數據的特征是一件很重要的事,因此叫做特征工程。

②為什么需要特征工程?

③特征工程包含的內容(了解)

  • 特征提取

將任意數據(如文本或圖像),轉換為可用于機器學習的數字特征。

  • 特征預處理

通過一些轉換函數將特征數據轉換成更加適合算法模型的特征數據過程。

  • 特征降維

指在某些限定條件下,降低隨機變量(特征)個數,得到一組“不相關”主變量的過程。

4.機器學習(模型訓練)

單獨講,請見該合集中的【機器學習的算法有哪些?】文章。

機器學習的算法有哪些?-CSDN博客

5.模型評估

單獨講,請見該合集中的【模型評估的介紹】文章。

模型評估的介紹-CSDN博客

小結

以上就是本篇文章的全部內容,喜歡的話可以留個免費的關注呦~~~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/90849.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/90849.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/90849.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

聚類里面的一些相關概念介紹闡述

一、性能度量外部指標:聚類結果與某個“參考模型”進行比較;系數: ,其中的 表示樣本是否屬于某類簇; 指數:,其中 表示樣本在兩個聚類結果中都是同一類簇, 表示在其中一個聚類結果中…

mmap機制

先看這個 MMAP 機制通俗易懂-CSDN博客 一句話 **mmap(memory map)是操作系統提供的“把文件或設備直接映射到進程虛擬地址空間”的機制,Java 里對應 `MappedByteBuffer`。** --- ### 1. 技術本質 - 系統調用:`mmap()`(POSIX)、`CreateFileMapping`(Windows)。 …

嵌入式硬件篇---驅動板

制作 ESP32 驅動板的核心是 “搭建 ESP32 與外設之間的橋梁”—— 因為 ESP32 的 GPIO 引腳輸出電流很小(最大 20mA),無法直接驅動大功率設備(如電機、繼電器、電磁閥等),驅動板的作用就是放大電流 / 功率&…

UniappDay01

1.技術架構2.創建uniapp項目 通過HBuilderX創建 官網安裝創建uniapp vue3項目安裝uniapp vue3的編譯器在工具欄啟動微信小程序開啟服務端口模擬器窗口分離和置頂 通過命令行創建 3.pages.json和tabbar案例 pages.json用來配置路由,導航欄,tabbar等頁面類…

子空間投影,投影矩陣,最小二乘法

一、子空間投影 1.1 投影與誤差向量b 在 向量a 上的投影即 a 上離 b 最近的點: paTbaTaa p \frac{a^T b}{a^Ta}a paTaaTb?a 我們記 誤差 e b - p,顯然誤差e 和 a 是正交的。 1.2 投影矩陣向量b 在子空間S上的投影是S中離b 最近的向量p。 我們做如下推…

基于FPGA的SPI控制FLASH讀寫

基于FPGA的SPI控制FLASH讀寫 文章目錄基于FPGA的SPI控制FLASH讀寫一、SPI簡介二、FLASH_M25P16簡介信號描述功能操作注意時序三、設計思路框圖設計狀態機設計四、上板驗證1、讀ID2、讀數據3、扇區擦除寫數據五、總結六、代碼一、SPI簡介 SPI是Serial Peripheral interface的縮…

Pytest 參數化進階:掌握 parametrize 的多種用法

概述 在自動化測試中,@pytest.mark.parametrize 不僅僅能用來為測試函數提供多組輸入數據,還能配合其他功能實現更復雜的測試邏輯。本文將帶你深入了解 @pytest.mark.parametrize 的多種常見用法,助你在不同場景下寫出更高效、更清晰的測試代碼 基礎用法回顧:單個參數化 …

K8S 九 安全認證 TLS

目錄第九章 安全認證訪問控制概述認證管理授權管理 RBACRBACRolerules中的參數RoleBinding9.4 準入控制其他K8S的TLS是什么(DeepSeek)1. 加密通信2. 身份認證(Authentication)3. 數據完整性K8s 中 TLS 的具體應用**1. API Server …

積分兌換小程序Java

某個學校為了激勵學生踴躍參加一些社會實踐活動,會對參與者給予一些校園積分,學生們獲得校園積分后可以使用校園積分在指定的老師那兌換一些學習用具,當前可兌換的物品和對應的積分數量如下:鉛筆1分橡皮2分作業本3分文具盒5分為了…

函數指針示例

使用函數指針來調用 printf。下面是對代碼的詳細解釋&#xff1a;&#x1f4c4; 源代碼解析#include <stdio.h>int main() {int (*myshow)(const char *, ...); // 聲明一個函數指針&#xff0c;指向可變參數函數printf("hello world!\n");myshow printf; /…

不坑盒子突然不見了怎么辦?

如果你安裝后之前一切正常&#xff0c;突然某天在Office的功能區看不到不坑盒子了&#xff0c;這種是插件被禁用了&#xff0c;重裝安裝插件、Office都是不能解決的&#xff0c;必須按下面的方法解決。WPS中1.隨便打開一個文檔&#xff0c;點擊文件-選項-信任中心&#xff0c;最…

Java面試全棧通關:從微服務到AI的技術深度解析

Java面試全棧通關&#xff1a;從微服務到AI的技術深度解析 面試現場&#xff1a;大廠技術終面室 面試官&#xff1a;謝飛機同學&#xff0c;今天我們將從基礎到架構&#xff0c;全面考察你的Java技術棧掌握程度。請真實展示你的技術水平。 謝飛機&#xff1a;&#xff08;挺胸抬…

《Java 程序設計》第 7 章 - 繼承與多態

引言在 Java 面向對象編程中&#xff0c;繼承與多態是兩大核心特性&#xff0c;它們共同支撐了代碼的復用性、擴展性和靈活性。本章將從繼承的基本實現開始&#xff0c;逐步深入到方法覆蓋、訪問控制、抽象類等概念&#xff0c;最終揭示多態的本質與應用。通過大量可運行的代碼…

ksql連接數據庫免輸入密碼交互

ksql連接數據庫免輸入密碼交互1. 使用 .pgpass 文件&#xff08;推薦&#xff09;2. 使用環境變量3. 使用連接字符串4. 修改 ksql 的別名&#xff08;簡化命令&#xff09;5. 注意事項6. 密碼含特殊字符轉義在 Kingbase 中使用 ksql 連接數據庫時&#xff0c;如果希望避免每次手…

UniApp H5 適配 PC 端新姿勢:打造跨設備一致體驗

在移動互聯網蓬勃發展的今天&#xff0c;很多開發者會選擇使用 UniApp 來開發多端應用&#xff0c;尤其是 H5 端&#xff0c;因其無需下載安裝即可訪問的特性&#xff0c;深受用戶喜愛。但 UniApp H5 應用在 PC 端直接打開時&#xff0c;往往會因為屏幕尺寸的巨大差異&#xff…

【MySQL#4】函數 復合查詢 內外連接

&#x1f4c3;個人主頁&#xff1a;island1314 ?? 歡迎關注&#xff1a;&#x1f44d;點贊 &#x1f442;&#x1f3fd;留言 &#x1f60d;收藏 &#x1f49e; &#x1f49e; &#x1f49e; 生活總是不會一帆風順&#xff0c;前進的道路也不會永遠一馬平川&#xff0c;如何面…

C++常見面試題之一

一、語言基礎與內存管理const與constexpr的區別&#xff1f;應用場景&#xff1f; const&#xff1a;運行時常量&#xff0c;修飾變量/函數不可修改。constexpr&#xff1a;編譯期常量&#xff08;C11&#xff09;&#xff0c;用于優化計算&#xff08;如數組大小&#xff09;。…

Golang 語言中的指針介紹

介紹&#xff1a;指針式一種數據類型&#xff0c;用來存儲值的內存地址&#xff0c;為了便于理解&#xff0c;我們也可以把指針未內存地址&#xff0c;指針類型只占用內存4個或 8 個字節&#xff0c;在Golang 語言中&#xff0c;類型名稱加 * 表示改類型的指針類型。指針類型變…

Flink 狀態管理設計詳解:StateBackend、State、RocksDB和Namespace

為什么需要 StateBackend&#xff1f;—— 職責分離原則我們可以用一個銀行的例子來類比&#xff1a;State (如 ValueState, ListState) 就像是你的銀行卡。AbstractKeyedStateBackend 就像是銀行的整個后臺系統&#xff08;包括總服務器、數據庫、風控系統、會計系統等&#x…

櫥柜鉸鏈的革命:炬森精密如何以創新科技重塑家居體驗

在現代化家居設計中&#xff0c;櫥柜不僅是存儲空間的核心&#xff0c;更是生活品質的象征。而作為櫥柜的“關節”&#xff0c;櫥柜鉸鏈的性能直接影響著日常使用的便捷性、安全性和耐久性。然而&#xff0c;許多消費者在櫥柜使用中常遭遇噪音干擾、頻繁松動或早期損壞等痛點&a…