目錄
前言
一、理解機器學習
1.1 機器學習的目的
1.2 機器學習的模型
1.3 機器學習的數據
二、學習機器學習要學什么
2.1 學習機器學習的核心內容
2.2 怎么選擇模型
2.3 怎么獲取訓練數據
2.4 怎么訓練模型
三、機器學習的門檻
3.1 機器學習的第一道門檻
3.2 機器學習的第二道門檻
3.3 機器學習的第三道門檻
前言
對于新人來說,開始學習機器學習可能會感到有些困難。例如一般會給出海一樣闊的學習清單,然后還需要掌握基礎數學知識、學習Python編程語言、學習機器學習基礎理論、實踐項目、參與社區和持續學習等方面的努力等等等等等等等等等等等一大堆的“剛性要求”及“說與不說都一樣的建議”。
與其說這些是學習建議或者學習指引,還不如說是“機器學習勸退書”。如果不抓住主干,而是繁枝雜葉,那么養豬都要買上十本書,看完隔壁家豬都下崽了。
下面結合實際的經驗,和一些真正上手人的經歷,今天我來分享一下機器學習上手要怎么搞。
一、理解機器學習
1.1 機器學習的目的
機器學習的目的就是通過X來預測Y,
1.2 機器學習的模型
但X與Y的關系往往不知,所以需要假設X與Y符合某個模型。而模型并非完全是死的,它預留了一些參數,例如線性模型y = wx,就預留了w作為參數,模型是固定的(它必然是線性的),但模型不是死的,可以通過參數w來調整線性關系的斜率。
1.3 機器學習的數據
模型中預留的參數如何確定?這時候就依靠歷史數據了,求解一個參數,使得模型在歷史數據中預測最準確,以此來確定模型的參數。
二、學習機器學習要學什么
2.1 學習機器學習的核心內容
由上而知,機器學習就是選擇一個模型,然后再用數據訓練模型,以達到我們的目的---用X預測Y。因此,重心就只有兩個:
(1)怎么選擇模型
(2)怎么獲取訓練數據
(3)怎么訓練
2.2 怎么選擇模型
要知道怎么選擇模型,就必須了解模型,了解更多的模型。只有桔子梨子桃子李子都吃過了,才能知道現在想吃什么。所以這是一個很簡單的問題, 多學幾個模型,玩幾個模型,多玩玩,就知道了。但是不是所有模型都要知道呢?當然不是,也是不可能的!就像梨子桃子桔子李子柚子柿子椰子梨子橙子車厘子都未必樣樣吃齊,一般先學著五六個常用模型,就算入門了。
機器學習基本的模型,包括線性回歸、邏輯回歸、支持向量機(SVM)、決策樹、隨機森林、聚類分析、降維等。這些模型可用于分類和回歸問題,如房價預測、股票走勢或測試成績等連續變化的案例。其中,線性回歸和邏輯回歸是處理回歸任務最常用的算法之一,而SVM、決策樹和隨機森林則是處理分類任務常用的算法。
在機器學習入門階段,建議先學習一些基礎模型,如線性回歸和邏輯回歸,以及一些基本的聚類方法和降維方法。然后,可以根據實際問題和數據集的特點,選擇適合的模型進行學習和應用。同時,還需要了解各種模型的應用場景、優缺點、參數設置等,以便更好地應用它們解決實際問題。
2.3 怎么獲取訓練數據
這里的獲取訓練數據,并非指獲取最原始的數據,而是指怎么獲取喂給模型的數據。這就涉及到數據清洗了,這里不鋪開講述,只要學習了模型,再看一兩個案例,就自然知道要把數據處理成什么樣來喂給模型了。因為不同的模型,所要求的數據也有個別的出入,實踐一兩下就自然知道要求了。實踐出真知!
知道模型要求什么數據,接下來就是數據的處理了,這就是實打實打編程苦力工,對于有編程基礎的同學來說,完全是肝的問題,而不是懂不懂的問題,不學自通。而對于沒有編程基礎的,也可以根據這些數據處理要求,作為編程的練習題,既可以學習數據清洗,又可以學習編程,一舉兩得,何樂而不為!
2.4 怎么訓練模型
訓練模型是最簡單不過的事情,根據機器學習包(例如python中的sklearn)的API說明,依樣畫葫蘆就行,根本不需要學習。屬于動手試試就知的那種,完全不會成為門檻。
API說明在哪里找?官網、百度、CSDN、知乎,滿大街都是,隨便搜一下拿來就用。
三、機器學習的門檻
3.1 機器學習的第一道門檻
機器學習的第一道門檻,在模型(算法)的學習上,但基本學過就行。這就是個吃梨子桃子桔子李子柚子柿子椰子梨子橙子車厘子的過程,吃過就知道味道了。
這個中可能會涉及到一些數學知識,其實不必介懷,一知半解也是沒關系的,不是人人都是美食家,也不是人人都是水果專家,一吃就知道這桃子是哪個品種,有沒有施藥,雨水有沒有充足,吃過就行了,大概知道個味道,也不影響我下次去買水果時選擇哪個水果。
3.2 機器學習的第二道門檻
機器學習的第二道門檻在于實踐,做一個模型,肯定是希望有效果的,如果總是訓練效果不好,這不免會打擊信心,這時候就需要耐心與信心加持了。相信數據,相信會有效果,耐心去分析問題,這里必須說明,很多時候都是出現在數據問題上,所以需要很仔細的去了解數據,分析數據,清洗數據。
3.3 機器學習的第三道門檻
相信有許多邁過了第一道,第二道,已經入門的同學,卻沒有繼續在機器學習上走下去。為什么?因為沒有實踐的機會!對!第三道門檻就是實踐的機會! 一份工作也好,一份自己的項目也好,“被需要”是很重要的! 在獲得實踐機會后,將機器學習融入生活,才算真正開啟了機器學習之路!
其實也沒寫幾個字,卻敲到手累了,有機會再細說。
最后,列出一些可以參考與學習的網站:
《1》人工智能學習路線圖2023版-黑馬程序員人工智能技術路線
《2》老餅|機器學習
《3》機器學習相關電子書_天賦好書(cnToFu.com)
《4》1. 監督學習 - sklearn中文教程 | 編程字典
如果覺得本文有幫助,點個贊吧!