前言
本文章是撥珠自己的學習筆記,自用為主,學習請移步專門教程,若有錯誤請大佬輕噴,也歡迎同好交流學習。
本文將闡述三個問題。
什么是機器學習?
監督學習、無監督學習到底在干什么?
分類、回歸、聚類又是怎么回事?
一、一句話說清:機器學習是干什么的?
想像你養了一只小狗。
第一次,你把飛盤扔出去,小狗不知道要去撿。
你反復示范、獎勵,它慢慢學會“看到飛盤→跑過去→叼回來”。
機器學習就是讓電腦像小狗一樣,通過“大量練習(數據)”自己學會一套規則,以后遇到新問題也能做出正確反應。
二、三個關鍵詞:人工智能、機器學習、深度學習
用“套娃”來理解:
人工智能(AI):最大的套娃,目標讓機器像人一樣聰明。
機器學習(ML):實現AI的一種方法——讓機器自己從數據里“練級”變強。
深度學習(DL):機器學習里的一個“大招”,用很深的神經網絡處理圖像、語音等復雜任務。
三、機器學習的四大門派
門派 | 通俗解釋 | 舉個栗子 |
---|---|---|
監督學習 | 老師帶著練:題目+標準答案一起給 | 給1000張“貓/狗”照片并告訴你每張是貓還是狗,讓電腦學會辨認新照片 |
無監督學習 | 自學:只給題目,不給答案 | 給你一堆用戶購物記錄,讓電腦自己把“相似購物習慣”的人分成幾組 |
半監督學習 | 少數老師+多數自學 | 100張帶標簽的貓狗照 + 9000張沒標簽的照,一起學 |
強化學習 | 試錯升級:做對獎勵,做錯懲罰 | AlphaGo跟自己下圍棋,贏了加分、輸了扣分,越下越厲害 |
四、監督學習:有標準答案的練習冊
分類問題(答案是一個類別)
例:郵箱收到新郵件,系統判斷是“垃圾郵件”還是“正常郵件”。
再例:花瓣長5cm→大概率是“B品種花”。
回歸問題(答案是一個數值)
例:根據房子面積、地段來預測“房價是多少萬元”。
再例:根據往年降雨量預測“明天河流水位會漲到多少米”。
五、無監督學習:沒有答案,自己找規律
最常見的是聚類(把相似的東西放一堆)。
例:
把一堆花瓣按“長度+寬度”畫在坐標紙上,人眼都能看出兩團點,電腦也能自動分成“很可能是兩種花”。好處:
給數據打好“疑似標簽”后,人類再去確認,比人工一張張標省事多了。
六、一張圖秒懂整體流程
原始數據 → 無監督學習先分堆(節省人工標注) → 得到帶標簽數據 → 交給監督學習模型訓練 → 模型上線做預測
七、小結
機器學習 = 讓電腦用“數據練習”變聰明。
監督學習:有答案,學“做題套路”。
分類:答案是一類。
回歸:答案是一個數。
無監督學習:沒答案,自己找“誰和誰像”。
深度學習:機器學習里用“多層神經網絡”的大招。