在正式進入機器學習與大模型的數學核心之前,我們需要先打好“語言”和“邏輯”的基礎。
這一章會從 集合與邏輯 入手,它們就像是編程中的語法規則:
- 集合告訴我們“對象屬于不屬于某個范圍”;
- 邏輯告訴我們“命題對不對、能不能推出新的結論”。
這些看似抽象的概念,在 AI 里非常重要:神經網絡的輸入數據本質上就是集合的元素,訓練過程中的條件判斷與優化也依賴邏輯和推理。
0-1 集合與邏輯基礎
集合運算
集合是什么?
集合(Set)就是一堆對象的“容器”。
- 數學里:集合 A=1,2,3A = {1, 2, 3}A=1,2,3
- 生活里:水果籃子 = {蘋果,香蕉,橘子}
集合的運算很直觀:
- 并集(Union):把兩個籃子的水果合并,去重。
A∪BA \cup BA∪B = 屬于 AAA 或屬于 BBB 的元素。 - 交集(Intersection):兩個籃子里都有的水果。
A∩BA \cap BA∩B = 同時屬于 AAA 和 BBB 的元素。 - 差集(Difference):只在 AAA,不在 BBB。
A?BA \setminus BA?B = 屬于 AAA 但不屬于 BBB 的元素。
圖示說明:上圖表示集合 AAA 與 BBB 的三種常見運算:并集、交集和差集。
在機器學習中的例子:
- 訓練數據集(Train)與測試數據集(Test)不能有交集,否則會導致“作弊式”高準確率。
- 語料庫的去重就是在做集合運算(去掉重復的句子 = 差集)。
命題邏輯
命題是什么?
命題(Proposition)就是一句 有真假值 的陳述。
- “明天會下雨” ? (要么真要么假)
- “你吃飯了嗎?” ? (沒有真假值,不是命題)
命題之間可以組合運算:
- 否定(NOT):如果 PPP 是“明天會下雨”,那 ?P\neg P?P 就是“明天不會下雨”。
- 合取(AND):P∧QP \land QP∧Q 表示“明天下雨 并且 我帶傘”。
- 析取(OR):P∨QP \lor QP∨Q 表示“明天下雨 或者 我帶傘”。
- 蘊含(Implication):P?QP \Rightarrow QP?Q 表示“如果明天下雨,那么我會帶傘”。
圖示說明:命題 PPP 和 QQQ 可以通過邏輯運算組合成新命題。
在機器學習中的例子:
- 決策樹 就是命題邏輯的“機械版”。例如:
- 如果(身高 > 1.8m)并且(體重 > 80kg),那么分類為“籃球運動員”。
- 神經網絡激活條件 也可以看作邏輯的“模糊版”:ReLU 就像是“如果大于0則輸出,否則為0”。
量詞
量詞 是在命題邏輯的基礎上,表示范圍的工具。常見的有:
- 全稱量詞(?,for all)
- “對于所有學生,都要考試”
- 數學符號:?x,;P(x)\forall x, ; P(x)?x,;P(x)
- 機器學習例子:?\forall? 樣本 xxx,我們都希望模型能預測正確。
- 存在量詞(?,there exists)
- “有些人喜歡咖啡”
- 數學符號:?x,;P(x)\exists x, ; P(x)?x,;P(x)
- 機器學習例子:?\exists? 一些超參數配置能讓模型收斂。
圖示說明:量詞規定了命題作用的范圍,全稱量詞要求“所有情況”,存在量詞只要求“至少一個”。
在機器學習中的例子:
- 在驗證模型時:
- 全稱量詞:理想情況是“? 測試樣本,預測正確”。
- 存在量詞:現實情況是“? 一些樣本被錯誤分類”。
小結
- 集合:幫助我們組織數據,避免數據泄露或混淆。
- 命題邏輯:是條件判斷和推理的基石,決策樹、規則模型都離不開它。
- 量詞:為邏輯加上范圍,用來表達“全部成立”還是“存在某些例外”。
聯系 AI 的意義:
集合與邏輯是機器學習數學的“語法”。理解這些,就能更自然地看懂模型定義(輸入集合、輸出集合)、損失函數約束(邏輯條件)、以及訓練目標(全稱 vs 存在)。