1-機器學習與大模型開發數學教程-第0章 預備知識-0-1 集合與邏輯基礎(集合運算、命題邏輯、量詞)

在正式進入機器學習與大模型的數學核心之前,我們需要先打好“語言”和“邏輯”的基礎。
這一章會從 集合與邏輯 入手,它們就像是編程中的語法規則:

  • 集合告訴我們“對象屬于不屬于某個范圍”;
  • 邏輯告訴我們“命題對不對、能不能推出新的結論”。

這些看似抽象的概念,在 AI 里非常重要:神經網絡的輸入數據本質上就是集合的元素,訓練過程中的條件判斷與優化也依賴邏輯和推理。


0-1 集合與邏輯基礎

集合運算

集合是什么?
集合(Set)就是一堆對象的“容器”。

  • 數學里:集合 A=1,2,3A = {1, 2, 3}A=1,2,3
  • 生活里:水果籃子 = {蘋果,香蕉,橘子}

集合的運算很直觀:

  1. 并集(Union):把兩個籃子的水果合并,去重。
    A∪BA \cup BAB = 屬于 AAA 或屬于 BBB 的元素。
  2. 交集(Intersection):兩個籃子里都有的水果。
    A∩BA \cap BAB = 同時屬于 AAABBB 的元素。
  3. 差集(Difference):只在 AAA,不在 BBB
    A?BA \setminus BA?B = 屬于 AAA 但不屬于 BBB 的元素。
集合 A
并集
集合 B
交集
差集 A-B

圖示說明:上圖表示集合 AAABBB 的三種常見運算:并集、交集和差集。

在機器學習中的例子

  • 訓練數據集(Train)與測試數據集(Test)不能有交集,否則會導致“作弊式”高準確率。
  • 語料庫的去重就是在做集合運算(去掉重復的句子 = 差集)。

命題邏輯

命題是什么?
命題(Proposition)就是一句 有真假值 的陳述。

  • “明天會下雨” ? (要么真要么假)
  • “你吃飯了嗎?” ? (沒有真假值,不是命題)

命題之間可以組合運算:

  1. 否定(NOT):如果 PPP 是“明天會下雨”,那 ?P\neg P?P 就是“明天不會下雨”。
  2. 合取(AND)P∧QP \land QPQ 表示“明天下雨 并且 我帶傘”。
  3. 析取(OR)P∨QP \lor QPQ 表示“明天下雨 或者 我帶傘”。
  4. 蘊含(Implication)P?QP \Rightarrow QP?Q 表示“如果明天下雨,那么我會帶傘”。
命題 P: 明天下雨
命題 Q: 我帶傘
P AND Q
P OR Q
如果 P 那么 Q

圖示說明:命題 PPPQQQ 可以通過邏輯運算組合成新命題。

在機器學習中的例子

  • 決策樹 就是命題邏輯的“機械版”。例如:
    • 如果(身高 > 1.8m)并且(體重 > 80kg),那么分類為“籃球運動員”。
  • 神經網絡激活條件 也可以看作邏輯的“模糊版”:ReLU 就像是“如果大于0則輸出,否則為0”。

量詞

量詞 是在命題邏輯的基礎上,表示范圍的工具。常見的有:

  1. 全稱量詞(?,for all)
    • “對于所有學生,都要考試”
    • 數學符號:?x,;P(x)\forall x, ; P(x)?x,;P(x)
    • 機器學習例子:?\forall? 樣本 xxx,我們都希望模型能預測正確。
  2. 存在量詞(?,there exists)
    • “有些人喜歡咖啡”
    • 數學符號:?x,;P(x)\exists x, ; P(x)?x,;P(x)
    • 機器學習例子:?\exists? 一些超參數配置能讓模型收斂。
全稱量詞 ?x
命題 P(x)
存在量詞 ?x

圖示說明:量詞規定了命題作用的范圍,全稱量詞要求“所有情況”,存在量詞只要求“至少一個”。

在機器學習中的例子

  • 在驗證模型時:
    • 全稱量詞:理想情況是“? 測試樣本,預測正確”。
    • 存在量詞:現實情況是“? 一些樣本被錯誤分類”。

小結

  • 集合:幫助我們組織數據,避免數據泄露或混淆。
  • 命題邏輯:是條件判斷和推理的基石,決策樹、規則模型都離不開它。
  • 量詞:為邏輯加上范圍,用來表達“全部成立”還是“存在某些例外”。

聯系 AI 的意義
集合與邏輯是機器學習數學的“語法”。理解這些,就能更自然地看懂模型定義(輸入集合、輸出集合)、損失函數約束(邏輯條件)、以及訓練目標(全稱 vs 存在)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/98890.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/98890.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/98890.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

字節 Trae vs 騰訊 CodeBuddy vs 阿里 Qoder:三大 AI-IDE 集成 OneCode 深度對比與體驗測評

一、對比背景:AI-IDE 與低代碼融合的行業必然性 在低代碼開發進入 “AI 賦能期” 的 2025 年,AI 驅動的集成開發環境(AI-IDE)已成為低代碼平臺效率提升的核心載體。全球 AI-IDE 市場規模突破 50 億美元,年增長率超 70…

DeerFlow 與 MCP 區別深度解析

目錄 引言 一、DeerFlow 與 MCP 的詳細概念說明 1. DeerFlow:面向研究自動化的多智能體應用框架 2. MCP:連接 AI 模型與外部系統的標準化通信協議 二、核心定位:應用框架與通信協議的本質 1. 角色不同 2. 技術架構 三、功能特性&…

視覺對象類型

矩形類型 對于最基本的視覺效果,Qt Quick 提供了一種繪制矩形的類型。這些矩形可以用顏色或垂直漸變著色。該類型還可以在矩形上繪制邊框。 若要繪制矩形以外的自定義形狀,請參閱類型或使用該類型顯示預渲染圖像。 import QtQuickItem {width: 320h

排序---選擇排序(Selection Sort)

一、選擇排序的基本概念 選擇排序(Selection Sort)是一種簡單直觀的排序算法,其核心思想是每次從待排序元素中找到最值(最小值或最大值),將其放到已排序序列的末尾,重復此過程直到所有元素完成排…

前端菜單權限方案

方案一:前端全量配置路由表 后端返回權限碼思路所有可能的路由都在前端 router 中靜態配置好(就像你現在這樣)。登錄后,后端返回當前用戶的菜單權限(通常是一個權限 code 列表)。前端根據權限碼過濾掉無權…

spring項目部署后為什么會生成 logback-spring.xml文件

以下內容為豆包生成,此處僅做記錄在 Spring 項目(尤其是 Spring Boot 項目)部署后生成 logback-spring.xml 文件,通常有以下幾種原因:1. 項目打包時主動包含了該文件logback-spring.xml 是 Logback 日志框架在 Spring …

如何解決pip安裝報錯ModuleNotFoundError: No module named ‘vaex’問題

【Python系列Bug修復PyCharm控制臺pip install報錯】如何解決pip安裝報錯ModuleNotFoundError: No module named ‘vaex’問題 摘要 在Python開發過程中,使用pip install時遇到錯誤是非常常見的情況。特別是在使用PyCharm等集成開發環境(IDE&#xff0…

實習總結——關于聯調解決的因CRC校驗導致協議交互失敗的調試經驗總結

1.場景還原:在我開發USB PD測試模塊時,發現待測主板始終不回復Request消息,導致我的測試失敗;此時我的任務就是快速定位這個協議交互失敗的原因,無論是軟件、硬件還是協同。2.大致的調試步驟:1.首先使用了邏…

STM32之RTC

RTC簡介 實時時鐘(Real Time Clock,RTC),本質是一個計數器,計數頻率常為秒,專門用來記錄時間。 普通定時器拿來作時鐘可行嗎?普通定時器無法掉電運行! RTC特性: 1,能提供時間&…

【OC】單例模式

文章目錄前言概念優缺點優點缺點兩種使用模式懶漢模式實現代碼運行結果餓漢模式實現代碼運行結果在自定義類方法時的幾種常見寫法總結前言 在之前我們已經學習過單例模式的有關內容,但是只是最簡單的單例,無法勝任多線程或者稍微多一點的情況便無法確定…

機器學習(七)決策樹-分類

一 概念1 決策節點通過條件判斷而進行分支選擇的節點。將樣本的屬性值,也就是特征值與決策節點上的值進行比較,從而判斷它的流向。2 葉子節點沒有子節點的節點,表示最終的決策結果。3 決策樹的深度所有節點的最大層次數決策樹具有一定的層次結…

IT 服務管理的新格局:從工單系統到一體化 ITSM 平臺

企業 IT 部門的角色轉變在過去,IT 部門更多被視為“技術支持”,主要負責設備維護和故障處理。但隨著數字化轉型加速,IT 已經成為業務連續性和創新的重要推動力。從客戶體驗到數據安全,從業務敏捷到成本控制,IT 服務管理…

創建一個Spring Boot Starter風格的Basic認證SDK

文章目錄前言設計思路SDK實現步驟1. 創建SDK Maven項目(sdk目錄)2. 實現配置類3. 實現認證邏輯4. 實現攔截器5. 實現自動配置6. 創建spring.factories文件使用方集成步驟1. 引入SDK依賴2. 配置Application屬性3. 創建測試接口4. 測試接口訪問SDK擴展功能…

mybatis處理統計sql進度丟失問題

如何處理統計sql進度丟失 SELECT sum(decimal_column) AS sum_value FROM your_table如上sql執行時沒有問題,在數據庫可視工具可以正常顯示,但是在mybatis執行時,卻出現解決辦法 使用轉 decimal 控制精度 SELECT CAST(SUM(decimal_column) A…

全球首款!科聰控制器獲德國 TüV 萊茵功能安全認證

近日,浙江科聰控制技術有限公司(以下簡稱"科聰")的安全移動機器人控制器MSC5000榮獲全球權威認證機構德國萊茵TV集團(TV Rheinland)頒發的功能安全認證證書。這款控制器是全球首款通過SIL3、PLe 認證的移動機…

pureadmin的動態路由和靜態路由

在 PureAdmin(基于 Vue3 的后臺管理框架)中,靜態路由和動態路由是實現路由管理的兩種方式,主要區別在于路由的定義時機、加載方式和靈活性,具體區別如下: 1. 靜態路由 定義方式:路由規則在代碼中…

第3章:CPU實戰

1. Linux操作系統CPU平均負載 以前我們總認為CPU使用率和CPU平均負載是一樣的,負載高了就是CPU使用率提高。但是到底是什么情況呢? 1.1. CPU的平均負載 單位時間內 系統處于 可運行狀態 和不可中斷狀態 的平均進程數,就是平均活躍進程數&a…

【Vue3】06-利用setup編寫vue(1)

其它篇章: 1.【Vue3】01-創建Vue3工程 2.【Vue3】02-Vue3工程目錄分析 3.【Vue3】03-編寫app組件——src 4.【Vue3】04-編寫vue實現一個簡單效果 5.【Vue3】05-Options API和Composition API的區別 6.【Vue3】06-利用setup編寫vue(1) 7.【Vue…

UDS NRC速查

目錄 NRC 一、通用NRC(0x10~0x5F) 二、數據相關NRC(0x70~0x8F) 三、會話與狀態NRC 注意事項 UDS中的NRC(Negative Response Code)即否定響應碼,用于在診斷通信中表示服務端無法成功執行客戶端請求的原因。以下是一些常用的UDS NRC碼及其含義: HEX Name Description 01 …

【AI論文】多模態大型語言模型的視覺表征對齊

摘要:通過視覺指令微調訓練的多模態大型語言模型(MLLMs)在各類任務中均取得了優異表現,然而在以視覺為中心的任務(如物體計數或空間推理)中,其性能仍存在局限。我們將這一差距歸因于當前主流的純…