Pytorch的安裝
通過Anaconda安裝PyTorch更為便捷
張量:(1)Tensor可以是高維的(2)并非是PyTorch中才有的概念(3)PyTorch運算的基本單元(4)基礎數據定義和運算(5)在PyTorch中支持GPU運算,自動求導等操作
機器學習兩種典型的任務:(1)分類任務是對離散值進行預測(2)回歸任務是對連續值進行預測
大模型中的相關概念
樣本:一條數據;
特征:被觀測對象的可測量特性,例如西瓜的顏色、瓜蒂、紋路、敲擊聲等;
特征向量:用一個 d 維向量表征一個樣本的所有或部分特征;
標簽(label)/真實值:樣本特征對應的真實類型或者真實取值,即正確答案;
數據集(dataset):多條樣本組成的集合;
訓練集(train):用于訓練模型的數據集合;
評估集(eval):用于在訓練過程中周期性評估模型效果的數據集合;
測試集(test):用于在訓練完成后評估最終模型效果的數據集合;
模型:可以從數據中學習到的,可以實現特定功能/映射的函數;
誤差/損失:樣本真實值與預測值之間的誤差;
預測值:樣本輸入模型后輸出的結果;
模型訓練:使用訓練數據集對模型參數進行迭代更新的過程;
模型收斂:任意輸入樣本對應的預測結果與真實標簽之間的誤差穩定;
模型評估:使用測試數據和評估指標對訓練完成的模型的效果進行評估的過程;
模型推理/預測:使用訓練好的模型對數據進行預測的過程;
模型部署:使用服務加載訓練好的模型,對外提供推理服務;
Step:一次梯度更新的過程;
Epoch:模型完成一次完整訓練集的訓練;
梯度:梯度是一個向量(矢量),函數在一點處沿著該點的梯度方向變化最快,變化率最大。
換而言之,自變量沿著梯度方向變化,能夠使因變量(函數值)變化最大。