🌟 歡迎來到AI奇妙世界! 🌟
親愛的開發者朋友們,大家好!👋
我是人工智能領域的探索者與分享者,很高興在CSDN與你們相遇!🎉 在這里,我將持續輸出AI前沿技術、實戰案例、算法解析等內容,希望能和大家一起學習、交流、成長!💡
🔥 為什么關注AI?
人工智能正在重塑世界!🌍
🚀 深度學習讓機器擁有“視覺”“聽覺”
🤖 **大模型(如GPT、文心一言)**改變人機交互方式
📊 數據科學賦能商業決策
🏥 AI醫療助力精準診斷
🛒 智能推薦優化用戶體驗
無論你是AI新手👶,還是資深極客👨💻,這里都有適合你的內容!📌 你將在這里看到什么?
? AI基礎入門(Python、TensorFlow/PyTorch)
? 實戰項目(圖像識別、NLP、推薦系統)
? 論文解讀(CVPR、NeurIPS最新研究)
? 行業動態(AI政策、大模型進展)
? 避坑指南(訓練技巧、調參經驗)💬 期待與你互動!
📢 評論區隨時交流,歡迎提問!
💌 私信開放,一起探討技術難題!
🤝 關注我,AI學習路上不迷路!最后,送上一句AI圈的經典名言:
“人工智能不會取代人類,但會用AI的人會取代不用AI的人。”
讓我們一起擁抱AI時代,用代碼改變未來!🚀
點擊關注👉,開啟AI之旅! 🔥🔥🔥
目錄
一.什么是機器學習
二.機器學習的工作流程
三.解釋上述流程的各步驟
1.獲取數據
①獲取到的數據種類
②數據中的名詞
③數據類型的構成
④數據分割
2.數據基本處理
3.特征工程
①什么是特征工程?
②為什么需要特征工程?
③特征工程包含的內容(了解)
特征提取
特征預處理
特征降維
4.機器學習(模型訓練)
5.模型評估
小結
一.什么是機器學習
機器學習是從數據中自動分析獲得模型,并利用模型對未知數據進行預測。
?簡單來說,計算機通過對新的數據進行分析,獲得一個模型,通過這個模型,計算機就可以預測未知屬性。
二.機器學習的工作流程
機器學習工作流程總結:?
- 獲取數據
- 數據基本處理
- 特征工程
- 機器學習(模型訓練)
- 模型評估:①結果達到要求,則上線服務 / ②結果沒達到要求,則重復上面的步驟
三.解釋上述流程的各步驟
1.獲取數據
①獲取到的數據種類
- 房屋價格:可能是小數,如105.5萬
- 電影數據:動作片/喜劇片等等
- 人物分類:可以按是否戴帽子 / 手里是否拿東西等等,來進行分類,沒有對錯之分,只是分類角度不同
②數據中的名詞
在數據集中一般:
- 一行數據我們稱為一個樣本
- 一列數據我們稱為一個特征
- 需要我們判斷的列(如上圖的電影類型),我們稱為目標值
- 有些數據有目標值,有些數據沒有目標值
如下圖,有的行就沒有電影類型,有的就有。
③數據類型的構成
- 數據類型一:特征值+目標值(目標值是連續的和離散的)
- 數據類型二:只有特征值,沒有目標值
④數據分割
- 機器學習一般的數據集會分成兩部分
- 訓練數據:用于訓練,構建模型
- 測試數據:在模型檢驗時使用,用于評估模型是否有效
- 劃分比例:
- 訓練集:70% ~ 80%
- 測試集:30% ~ 20%
2.數據基本處理
????????對數據進行缺失值、去除異常值等處理。
????????舉例:比如我們讓一群人填寫問卷調查,肯定有人會有部分項不填寫(缺失值),或者年齡填寫1000歲(異常值),這兩種情況就需要進行處理。
3.特征工程
①什么是特征工程?
????????特征工程是使用專業背景知識和技巧,對數據進行處理,使得特征能在機器學習算法上發揮更好的作用。
? ? ? ? 意義:會直接影響機器學習的效果。
????????簡單理解就是,進一步對數據進行處理。
????????因為工程一般都很重要(比如蓋樓工程),所以就表示提取數據的特征是一件很重要的事,因此叫做特征工程。
②為什么需要特征工程?
③特征工程包含的內容(了解)
-
特征提取
將任意數據(如文本或圖像),轉換為可用于機器學習的數字特征。
-
特征預處理
通過一些轉換函數將特征數據轉換成更加適合算法模型的特征數據過程。
-
特征降維
指在某些限定條件下,降低隨機變量(特征)個數,得到一組“不相關”主變量的過程。
4.機器學習(模型訓練)
單獨講,請見該合集中的【機器學習的算法有哪些?】文章。
機器學習的算法有哪些?-CSDN博客
5.模型評估
單獨講,請見該合集中的【模型評估的介紹】文章。
模型評估的介紹-CSDN博客
小結
以上就是本篇文章的全部內容,喜歡的話可以留個免費的關注呦~~~