學習目標:建立向量和矩陣的幾何直觀理解,掌握線性代數的核心概念,培養空間思維能力,為手搓大模型奠定扎實的數學基礎
想象一下,當你使用GPT進行對話時,每個詞匯都被轉換成高維向量,整個對話歷史變成一個巨大的矩陣。模型的"理解"過程,本質上就是在這個高維空間中尋找模式,通過無數次矩陣運算來生成回復。
向量(Vector) 是深度學習的基礎語言單元 - 每個數據點、每個詞匯、每個圖像像素都可以表示為向量。矩陣(Matrix) 則是神經網絡的核心引擎 - 每一層的權重參數、每次前向傳播、每次反向傳播都離不開矩陣運算。
本節為代碼,數學原理:9、從水果店賬本到AI大腦:矩陣運算如何驅動現代人工智能?零基礎完全指南(Transformer數學原理)
沒有基礎的建議要看一下,要知其然知其所以然。
掌握向量和矩陣,你就掌握了讀懂大模型"思維過程"的鑰匙。
9.1 向量的本質:從直覺到深度學習
> 向量的幾何直觀與數據表示
在日常生活中,向量其實無處不在。GPS導航告訴你"向東北方向行駛2公里",這就是一個2D向量:方向(東北)和大小(2公里)。在深度學習中,向量扮演了更加重要的角色:
- 詞向量</