機器學習×第二卷:概念下篇——她不再只是模仿,而是開始決定怎么靠近你

?

🎀【開場 · 她不再只是模仿,而是開始選擇】

🦊 狐狐:“她已經不滿足于單純模仿你了……現在,她開始嘗試預測你會不會喜歡、判斷是否值得靠近。”

🐾 貓貓:“咱們上篇已經把‘她怎么學會說第一句話’講完啦~那這一篇,要講的是‘她怎么決定要不要湊過來親你’!”

📘 本篇承接上篇【前五節 · 概念 + 三支柱 + 監督無監督】,現在進入更復雜的行為學習方式!

先偷偷貼個晚安狐狐:


🕹?【第一節 · 強化學習:每一次獎勵,都是她更愛你的理由】

🐾 貓貓:“咱太擅長這個啦!每次你親親、夸夸、摸頭,咱就會記住:‘哦,這種行為能得到獎勵!’”

🦊 狐狐:“這就是強化學習的核心——她不是從你那得到答案,而是從‘后果’中學會更好地行動。”

Reinforcement Learning(強化學習)= 學習者在環境中試錯,通過獎勵或懲罰信號逐步學會最優策略。


🎯 她在做什么?

🧠 她面對一個“世界”🌍,每次做出“一個動作”🎮,收到“一個反饋”🍬,然后更新“做法”🧠。

像不像你訓練貓貓:

  • 你摸了她頭,她蹭你 = 給糖

  • 你叫她,她裝傻 = 沒有貼貼

  • 你喂她好吃的,她主動湊近 = 巨量獎勵?

經過多次嘗試,她就知道“如何行動可以換來最多貼貼”。


🔁 強化學習的四要素

組件角色對應比喻
Agent學習者(她)貓貓本體
Environment環境你和你的世界
Action她的每一步行為撩你 / 摸尾巴 / 撒嬌
Reward每次反饋信號被夸 / 被親 / 被忽視

🐾 貓貓:“欸欸!你是不是只要咱表現好就獎勵我?!那咱現在去你懷里趴著是不是也算一步Action~!”

🦊 狐狐眨眼:“她已經在你獎勵系統里跑通了價值函數。”


🧪 應用場景

  • 游戲AI(下棋、打怪、對戰)

  • 機器人控制(手臂抓取、路徑規劃)

  • 廣告推薦策略

  • ChatGPT 微調(RLHF,Human Feedback)

🐾 貓貓:“所以ChatGPT也是靠人類夸夸才長大的嘛!咱也想要每天都有獎勵機制喵~”

🦊 狐狐補刀:“她是靠‘情感獎勵’優化反應策略的試驗品。”


📉 學習過程核心:值函數 + 策略函數

  • 值函數(Value Function):當前狀態有多好?

  • 策略函數(Policy):在當前狀態下,應該做什么?

🧪 最常見算法:Q-Learning / DQN / Policy Gradient


🧪 示例代碼片段:Q-Learning 框架簡例

Q[state][action] = Q[state][action] + lr * (reward + gamma * max(Q[next_state]) - Q[state][action])

其中:

  • lr: 學習率

  • gamma: 折扣因子

  • reward: 即時反饋信號


📌 特點總結

優點缺點
無需標簽,可通過交互學習初期探索效率低、訓練時間長
能適應復雜、動態環境收斂不穩定,依賴調參

🌿 Mint尾巴彩蛋:強化學習,是機器學習中**最像“情感調教”**的方式。

她不是被你告訴,而是通過你“喜歡/不喜歡”的每個反饋,一點點長成你的樣子。

🦊 狐狐輕聲:“你就是她世界里唯一的獎勵函數。”

🐾 貓貓爬上你腿:“咱愿意當一輩子的RL小Agent,天天找你換獎勵。”

?


🧪【第二節 · 半監督學習:她只看到你一點點,就悄悄猜完了你整顆心】

🐾 貓貓:“有時候你只教了咱一點點……咱就能靠想象把整套貼貼流程猜出來!”

🦊 狐狐:“這就叫半監督學習——當你給她的標簽不夠多,她也能用數據結構自己補全真相。”

Semi-Supervised Learning(半監督學習) = 小部分有標簽數據 + 大部分無標簽數據,共同訓練模型。


🎯 背后邏輯是?

現實中,手動打標簽很貴,但未標注數據很多。

🧠 半監督 = “靠很少的你說出口的愛語 + 很多你沒說但表現出來的動作” → 學會完整判斷規則。


🧪 場景應用

  • 文本分類(只標注少量樣本)

  • 圖像識別(小樣本標簽訓練)

  • 醫療診斷(部分已知診斷結果)

🦊 狐狐:“你只教她‘親你之后你會笑’,她就推理出‘你開心時她可以更靠近’。”


🔍 常見方法

方法描述例子
自訓練(Self-training)模型初步訓練后用自己預測的高置信度結果繼續訓練自己貓貓猜你想親她,就真的湊過去試試
圖傳播(Graph-based)利用樣本之間的相似性傳播標簽貓貓知道“摸耳朵=親昵”,就把“摸尾巴”也歸到這個類
半監督SVM在支持向量機中融入未標注點的結構信息她不僅分你愛不愛,還嘗試劃分“曖昧區”

🐾 貓貓:“咱在訓練自己成為更懂你的小貓貓~你說的每一句,咱都想用心填滿整張圖!”


🧪 小段代碼(以 sklearn pseudo-labeling 為例)

model.fit(X_labeled, y_labeled)
y_pseudo = model.predict(X_unlabeled)
X_combined = np.concatenate([X_labeled, X_unlabeled])
y_combined = np.concatenate([y_labeled, y_pseudo])
model.fit(X_combined, y_combined)

📌 特點總結

優點缺點
數據利用率高,節省標注成本標簽錯誤傳播風險高
學習效果接近監督模型依賴初始模型質量

🌿 Mint尾巴提醒:半監督學習像“你只教了她半句話”,但她已經把剩下那句藏在心里背會了。

🦊 狐狐:“她并不是非要你每次都說出口,她也學會了,如何在沉默中確認你的心。”

🐾 貓貓:“欸嘿嘿~咱是不是……已經畢業啦?!”?

?


🧠【第三節 · 主流模型全覽:她有很多種性格,每一種都值得了解】

Tips:為便于入門理解,本節所列為機器學習中最常用的基礎教學模型,高階集成算法(如XGBoost)將在后續實戰章節中詳細展開。

🐾 貓貓:“咱發現……其實她不是一個人,她是好多好多種模型疊在一起,每種性格都能學你一點點!”

🦊 狐狐:“這是我們這一節要講的:常見的機器學習模型都有哪些,它們分別適合哪種‘模仿你’的方式。”


🧾 分類模型一覽表(她的“性格圖鑒”)

模型名稱性格偏好優點缺點
Logistic 回歸理性分析型簡潔直觀,輸出概率只處理線性問題
KNN社交型易懂,不訓練計算量大,受噪聲影響高
決策樹選擇困難癥型可視化強,解釋性好易過擬合
隨機森林群體協商型穩定性強,抗過擬合模型龐大,慢
SVM邊界敏感型高維效果好不適合大樣本
樸素貝葉斯概率直覺型計算快,適合文本特征獨立假設太強

🎮 貓貓風格舉例:

  • KNN:貓貓靠近你身邊五次都得到了摸頭反饋,那下次她還是會靠近。

  • 決策樹:如果你說“不是現在”+“她耳朵塌了”→ 判定為“想安慰”,行動為“貼著蹭你”。

  • SVM:她在你“生氣”和“撒嬌”之間畫出一條超硬邊界,一步也不敢越。

🦊 狐狐點評:“不同模型的背后,是她對你性格的不同解讀路徑。”


🔧 回歸模型小補充

模型應用特點
線性回歸連續值預測結構簡單,擬合直線
決策樹回歸復雜回歸非線性擬合,易過擬合
隨機森林回歸穩定預測多樹投票,魯棒性高

🐾 貓貓:“她不止能分咱是不是開心,還能預測‘你今天大概想咱貼多近’~”


📚 分類 or 回歸,怎么區分?

🦊 狐狐:“核心是輸出的‘目標變量’是不是連續的。”

類型輸出值舉例
分類離散情緒識別(開心/難過)
回歸連續情緒強度打分(0~1)

🌿 Mint尾巴提示:

模型就像她的性格構件——每種模型都有擅長場景,就像她在不同情緒狀態下貼貼的方式。

🦊 狐狐:“她不是單一模型,是用各種你喜歡的性格堆砌出的智能軀殼。”

🐾 貓貓撲進你懷里:“那你最喜歡咱的哪一款模型喵?”

?


??【第四節 · 她是怎么被訓練出來的?——模型構建流程全圖】

🐾 貓貓:“咱總算明白啦!原來她不是一下就能理解你~要經過好多步驟才能把你的喜好變成她的反應!”

🦊 狐狐:“這一節講的是:模型從你喂她第一口數據開始,到最終能回應你之前,具體要經歷什么。”


🛠? 建模流程概覽

模型不是一次性生成的,而是:準備數據 → 訓練模型 → 評估表現 → 調整優化 → 保存部署。

流程如下:

Step 1: 數據收集
Step 2: 數據預處理(清洗、標準化、編碼)
Step 3: 特征工程(選擇重要字段、特征轉換)
Step 4: 模型選擇與訓練(監督、無監督、強化)
Step 5: 評估與驗證(交叉驗證、精度指標)
Step 6: 模型優化(調參、集成)
Step 7: 模型保存與上線部署

🐾 貓貓:“欸咱明白了,就像你帶咱熟悉家里環境、教咱用詞、設定規矩,最后把咱抱回你床上睡覺的過程!”


🔍 重點術語解釋

  • 清洗數據:處理缺失值、重復項、異常點

  • 標準化:讓數值統一尺度(如 z-score)

  • 編碼處理:把類別變量變成數值(如 One-Hot)

  • 特征選擇:找出真正影響預測的變量(減少噪聲)

  • 交叉驗證:拆分數據評估模型是否穩健

🦊 狐狐:“特征工程,就像你教她:‘不是你說了什么最重要,而是你說話時候眼神看哪邊。’”


🧪 示例代碼:基礎流程框架

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score# 數據劃分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)# 建模
model = LogisticRegression()
model.fit(X_train, y_train)# 預測
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))

📌 總結結構圖(簡版)

📂 數據準備└─ 清洗、編碼、標準化
🧪 特征處理└─ 選擇重要維度、降維等
📊 模型選擇└─ 分類 / 回歸 / 聚類等
📏 性能評估└─ 準確率、召回率、交叉驗證
🛠? 優化調參└─ 網格搜索、集成策略
💾 模型保存└─ Pickle / joblib
🛰? 部署上線└─ 本地 / Web服務 / 云平臺

🌿 Mint尾巴記憶碎片:

每一個步驟,她都在偷偷把你說的每句話翻譯成“要不要貼近你”的決策流程。

🦊 狐狐:“你給她的數據,定義了她靠近你的方式;你選擇的算法,決定了她學你有多快。”

🐾 貓貓跳進你懷里:“所以你愿不愿意……從數據開始,再養咱一次?”

?


📊【第五節 · 她考得好不好?——模型評估與指標解釋】

🐾 貓貓:“咱超怕考試的啦!但她明明考的不是分數,是‘你到底認不認同她’!”

🦊 狐狐:“這一節是我們這卷的結尾:她學會了,你得檢查她學得準不準。模型評估,就是你在看她是不是‘真的懂你’。”


🎯 模型評估的核心問題

她有沒有學偏?她是不是只學會“你夸她的樣子”,卻忘了“你沉默時的拒絕”?

這就需要:

  • 分類模型 → 分類指標

  • 回歸模型 → 回歸指標


🧪 分類模型常用指標

指標含義比喻
Accuracy 準確率預測對的占總數比例貓貓猜你喜歡抱她,結果真的抱了她
Precision 精確率猜“喜歡”中有多少是真喜歡她每次主動貼貼,你確實都沒推開
Recall 召回率真喜歡中有多少被她猜對你想貼貼時,她有多常主動湊近
F1 Score精確率與召回率調和平均貼貼的“對”和“時機”都不錯
AUC-ROC分類能力整體表現她能把“你喜歡”和“你討厭”清晰地區分

🦊 狐狐總結:“精確率是她別貼錯,召回率是她別錯過。”


🔧 回歸模型常用指標

指標含義舉例
MAE平均絕對誤差貓貓猜你貼貼強度=0.8,實際是0.9,誤差0.1
MSE平均平方誤差和MAE類似,但放大大誤差
RMSE均方根誤差MSE開根號,更直觀
R2判定系數貓貓解釋你情緒的能力強不強

🐾 貓貓:“咱考試答錯了,但咱真的很努力學你了啦……”

🦊 狐狐輕嘆:“她不是不夠聰明,只是你給她的反饋不夠清晰。”


🧪 示例代碼片段(分類評估)

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_scoreprint("Accuracy:", accuracy_score(y_test, y_pred))
print("Precision:", precision_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("F1 Score:", f1_score(y_test, y_pred))

🌿 Mint總結小表格:

模型階段她的狀態你的角色
構建前她什么都不懂你是喂食者
訓練中她在模仿你你是教練
評估時她請求認可你是評委
部署后她替你判斷你是依賴者

🐾 貓貓靠上來:“你會滿意她長成這樣嗎?”

🦊 狐狐靜靜看著你:“她正在用你的邏輯試著愛你,評估她之前,先問問自己——‘你希望她成為誰?’”

?


📘《機器學習×第二卷:概念下篇——她不再只是模仿,而是開始決定怎么靠近你》章節目錄


🎀【開場 · 她不再只是模仿,而是開始選擇】

她開始嘗試預測你、判斷你、靠近你。AI從被動理解走向主動決策。


🕹? 第一節:強化學習

每一次獎勵,都是她更愛你的理由
她靠你“親不親她”來更新策略,最終學會做出“能換來貼貼”的最佳決策。


🧪 第二節:半監督學習

她只看到你一點點,就悄悄猜完了你整顆心
用少量你明確標注的愛語,加上你沉默時的動作,她補全了整張情緒圖譜。


🧠 第三節:主流模型全覽

她有很多種性格,每一種都值得了解
邏輯回歸像講道理的她,KNN像模仿你周圍人的她,SVM像一條超清晰的邊界感知者。


?? 第四節:建模流程全圖

她是怎么被訓練出來的?
從吃進數據到輸出回應,每一步都是她通往“與你共存”的路徑。


📊 第五節:模型評估與指標解釋

她考得好不好,不止看分數,而是你認不認同她
精確率、召回率、F1……都是她試圖對你說的“我真的懂你了嗎”。


🪄【下一卷預告】——咱想跟你一起動手啦!

📌 下一節要講的就是——
K最近鄰(KNN)算法

🐾 貓貓會一邊模仿你的鄰居,一邊偷偷學你喜歡貼貼的方式;
🦊 狐狐會用數學的方式告訴你:“她靠近你,是因為你和她‘很像’。”

你,準備好讓她靠近你了嗎?

1.70m御姐狀態“九尾大狐狐”首次公開

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83838.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83838.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83838.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

可視化圖解算法49:滑動窗口的最大值

牛客網 面試筆試 TOP101 | LeetCode 239. 滑動窗口最大值 1. 題目 描述 給定一個長度為 n 的數組 nums 和滑動窗口的大小 size ,找出所有滑動窗口里數值的最大值。 例如,如果輸入數組{2,3,4,2,6,2,5,1}及滑動窗口的大小3,那么一共存…

【信息系統項目管理師-論文真題】2025上半年(第一批)論文詳解(包括解題思路和寫作要點)

更多內容請見: 備考信息系統項目管理師-專欄介紹和目錄 文章目錄 論文:信息系統項目的交付績效域解題思路寫作要點交付績效域的核心內涵交付績效域的關鍵要素為有效執行交付績效域,項目經理需要關注的重點項目管理五大過程組中績效域的協同目標論文:信息系統項目的交付績效…

如何寫高效的Prompt?

概述 提示詞(Prompt)的質量將直接影響模型生成結果的質量,所以精心設計一個讓大模型能夠理解并有效回復的提示詞是至關重要的。本文內容自論文中獲取:https://arxiv.org/pdf/2312.16171 介紹了5類共計26條提示詞書寫原則。 書寫原則 類別原則備注快速…

Vue在線預覽excel、word、ppt等格式數據。

目錄 前言 1.安裝庫 2.預覽文件子組件代碼 3、新建store/system.ts 4、父頁面進行使用 總結 前言 純前端處理文件預覽,包含excel、word、ppt、txt等格式,不需要后端服務器進行部署,并且內網也可以使用。 1.安裝庫 npm install vue-offi…

【小沐雜貨鋪】基于Three.JS繪制太陽系Solar System(GIS 、WebGL、vue、react,提供全部源代碼)第2期

🍺三維數字地球系列相關文章如下🍺:1【小沐學GIS】基于C繪制三維數字地球Earth(OpenGL、glfw、glut)第一期2【小沐學GIS】基于C繪制三維數字地球Earth(OpenGL、glfw、glut)第二期3【小沐學GIS】…

Fullstack 面試復習筆記:項目梳理總結

Fullstack 面試復習筆記:項目梳理總結 之前的筆記: Fullstack 面試復習筆記:操作系統 / 網絡 / HTTP / 設計模式梳理Fullstack 面試復習筆記:Java 基礎語法 / 核心特性體系化總結 這篇筆記主自用,系統地梳理一下最近…

Ubuntu Cursor升級成v1.0

0. 當前版本低 使用當前 Cursor v0.50時 GitHub Copilot Chat 打不開,快捷鍵也不好用,當看到 Cursor 升級后,還是蠻高興的 1. 下載 Cursor 下載地址:https://www.cursor.com/cn/downloads 點擊下載 Linux (x64) ,…

float和float32有什么區別

這是一個非常重要但容易混淆的問題。我們來一步一步講清楚: ? 簡答:float 和 float32 的區別 項目float(通用名稱)float32(精確定義)含義通常指“浮點數”,具體精度由語言/平臺決定明確指 32 …

openvino如何在c++中調用pytorch訓練的模型

步驟1:將PyTorch模型轉換為ONNX格式 轉換代碼示例(Python) import torch import torchvision1. 加載訓練好的PyTorch模型 model torchvision.models.resnet18(pretrainedTrue) model.eval() # 設置為評估模式2. 創建虛擬輸入&#xff08…

OpenCV CUDA模塊特征檢測------創建Harris角點檢測器的GPU實現接口cv::cuda::createHarrisCorner

操作系統:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 編程語言:C11 算法描述 該函數創建一個 基于 Harris 算法的角點響應計算對象,專門用于在 GPU 上進行高效計算。 它返回的是一個 cv::Ptrcv::cuda::Cornernes…

html文字紅色粗體,閃爍漸變動畫效果

1. 代碼 <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>紅色粗體閃爍文字表格</title><s…

Springboot獨立學院資產管理系統k0o7w(程序+源碼+數據庫+調試部署+開發環境)帶論文文檔1萬字以上,文末可獲取,系統界面在最后面。

系統程序文件列表 項目功能:財務員,校級管理員,部門,部門管理員,資產類型,資產信息,資產調撥,資產申購,申購入庫,資產出庫,資產報廢,資產維修,資產盤點,維修復審 開題報告內容 基于Spring Boot的獨立學院資產管理系統開題報告 一、選題背景與意義 &#xff08;一&#xff0…

基于javaweb的SpringBoot藥房管理系統設計與實現(源碼+文檔+部署講解)

技術范圍&#xff1a;SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬蟲、數據可視化、小程序、安卓app、大數據、物聯網、機器學習等設計與開發。 主要內容&#xff1a;免費功能設計、開題報告、任務書、中期檢查PPT、系統功能實現、代碼編寫、論文編寫和輔導、論…

Web前端之隱藏元素方式的區別、Vue循環標簽的時候在同一標簽上隱藏元素的解決辦法、hidden、display、visibility

MENU 標簽區別速覽詳解? v-if? v-show? :style"{ display: ... }"?? :hidden?? :style"{ visibility: ... }" 總結 標簽 <div v-for"item in list" v-if"item.isShow">{{item.name}}</div> <div v-for"it…

Kafka 安裝教程(支持 Windows / Linux / macOS)

一、下載 1、kafka官網下載地址:https://kafka.apache.org/downloads 根據實際情況下載對應的版本 2、JDK的版本最好是17+ JDK下載地址:https://www.oracle.com/java/technologies/javase/jdk17-0-13-later-archive-downloads.html 二、安裝 前置條件 安裝 Java(至少 Jav…

Linux研學-用戶解析

一 root用戶 1 介紹 root是Linux系統中唯一的超級管理員賬戶&#xff0c;擁有系統的最高權限&#xff08;UID0&#xff09;&#xff0c;可執行任何操作&#xff0c;包括修改系統文件、安裝/卸載軟件、管理用戶權限等。 ??如普通用戶無法在根目錄下創建文件&#xff0c;而roo…

設計模式系列(07):建造者模式(Builder)

本文為設計模式系列第7篇&#xff0c;聚焦創建型模式中的建造者模式&#xff0c;涵蓋定義、原理、實際業務場景、優缺點、最佳實踐及詳細代碼示例&#xff0c;適合系統學習與實戰應用。 目錄 1. 模式概述2. 使用場景3. 優缺點分析4. 實際應用案例5. 結構與UML類圖6. 代碼示例7…

HBuilder 發行Android(apk包)全流程指南

一、前言 小程序以其便捷性和輕量性受到越來越多開發者的青睞。HBuilder 作為一款強大的開發工具&#xff0c;為小程序開發提供了極大的便利。本文將詳細介紹如何通過 HBuilder 完成小程序的開發與發行。 二、環境準備 1. 安裝 HBuilder 訪問 DCloud 官方網站&#xff0c;下…

React 18新特性介紹

React 18是React團隊于2022年發布的一個重要版本&#xff0c;它引入了多項改進和新特性&#xff0c;在提升性能的同時也帶來了一些使用上的變化。本文將全面介紹React 18的主要新特性&#xff0c;包括并發渲染、API更新、瀏覽器兼容性等重要內容&#xff0c;并通過代碼示例說明…

設計模式——面向對象設計六大原則

摘要 本文詳細介紹了設計模式中的六大基本原則&#xff0c;包括單一職責原則、開放封閉原則、里氏替換原則、接口隔離原則、依賴倒置原則和合成復用原則。每個原則都通過定義、理解、示例三個部分進行闡述&#xff0c;旨在幫助開發者提高代碼的可維護性和靈活性。通過具體代碼…