大模型筆記1——李宏毅《2025機器學習》第一講

大模型筆記1——李宏毅《2025機器學習》第一講

web/2025/8/6 23:04:30/文章來源:https://blog.csdn.net/qq_41697157/article/details/149862784

本篇筆記內容

1、學習本節課需要的前置知識

了解大模型的訓練過程：預訓練、后訓練、強化學習（2024年生成式AI導論前8講）
了解基礎機器學習、深度學習概念（如transformer）（2021年機器學習課程）

2、本節課的大綱

大模型有怎樣的行為：
- 思考reasoning
- 使用工具（deepreasearch、使用瀏覽器、詢問人類反饋）
運作機制：
- 人類給定輸入，大模型給輸出（輸入輸出可以是文字、語言、圖片）
- 生成式AI的基本原理——文字接龍
  - 根據給定的一串token，決定下一個token
  - 輸入給定的token，確定輸出的一串token，哪個token的概率最大。因為有概率的參與，所以一模一樣的輸入也會有不一樣的輸出。
  - 為什么需要深度學習？不精準的比喻是，深度學習可以把輸入拆解成為多個步驟，因此相較于一次性計算所有數據，深度學習多層計算拆開后減少運算量，比較簡單。
模型是怎樣產生出來的
- 神經網絡包含“架構”和“參數”兩部分，其中架構包含如“神經網絡有多少層”等，是人為定義好的，一般說工程師調參就是調整架構。（能調整的架構參數，就叫做超參數。參數，則模型是需要通過訓練資料學習的）
- 找出參數過程，就是模型訓練，需要大量語料

零、前置準備&課程大綱

一、有什么行為

1）大模型會推理

2）大模型會使用工具

deep research
使用瀏覽器（操作電腦 open ai operator）
詢問人類反饋

二、運作機制

1）給定輸入，有輸出

輸入輸出都可以是很復雜的東西，比如文字、圖片、聲音

2）生成式AI的基本原理——文字接龍

給定一串token，決定下一個token

輸入給定的token，輸出一串概率分布，確定輸出的一串token，哪個token的概率最大。因為有概率的參與，所以一模一樣的輸入也會有不一樣的輸出。

為什么需要深度學習，不精準的比喻是，深度學習可以把輸入拆解成為多個步驟，因此相較于一次性計算，深度學習比較簡單。

如果深度學習的層數不夠，也可以用前一個深度學習的輸出作為下一個深度學習的輸入

三、模型是怎樣產生出來的

神經網絡包含“架構”和“參數”兩部分

其中架構包含如“神經網絡有多少層”等，是人為定義好的。

一般說工程師調參就是調整架構。

能調整的架構參數，就叫做超參數。參數，則是模型需要通過訓練資料學習的。

找出參數過程，就是模型訓練

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/92097.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/92097.shtml
英文地址，請注明出處：http://en.pswp.cn/web/92097.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

CSS scrollbar-width：輕松定制滾動條寬度的隱藏屬性

CSS scrollbar-width：輕松定制滾動條寬度的隱藏屬性

在前端設計中，滾動條往往是一個容易被忽略的細節。默認的滾動條樣式常常與頁面設計格格不入，尤其是寬度 —— 過寬的滾動條會擠占內容空間，過窄又可能影響用戶操作。而 CSS 的scrollbar-width屬性，就像一把 “精細的尺子”&#x…

閱讀更多...

小迪23年-28~31-js簡單回顧

小迪23年-28~31-js簡單回顧

前端-js開發課堂完結后欲復習鞏固也方便后續-重游-故寫此篇從實現功能過渡到涉及的相關知識點知識點 1、 JS 是前端語言，是可以被瀏覽器“看到”的，當然也可以被修改啊，被瀏覽器禁用網頁的 JS 功能啊之類的。所以一般都是前后端分離開發&…

閱讀更多...

JavaScript 概述

JavaScript 概述

JavaScript 是一種高級、解釋型編程語言，主要用于網頁開發，使其具備動態交互功能。它是網頁三大核心技術之一（HTML、CSS、JavaScript），能夠直接嵌入 HTML 頁面并在瀏覽器中執行。核心特性動態弱類型語言 JavaScript 是…

閱讀更多...

Mermaid流程圖可視化系統：基于Spring Boot與Node.js的三層架構實現

Mermaid流程圖可視化系統：基于Spring Boot與Node.js的三層架構實現

什么是Mermaid?系統架構設計三層架構 overview架構交互流程核心組件詳解 1. Spring Boot后端2. Node.js中間層3. 前端界面功能實現 1. 節點和關系管理2. 流程圖渲染3. 主題切換4. 導出功能使用指南啟動步驟頁面操作總結與展望什么是Mermaid? Mermaid流程圖可視化系統…

閱讀更多...

R 數據框：高效數據處理與分析的利器

R 數據框：高效數據處理與分析的利器

R 數據框：高效數據處理與分析的利器引言在數據科學和統計分析領域，R語言因其強大的數據處理能力和豐富的統計模型而備受推崇。R數據框（data frame）是R語言中一種重要的數據結構，它以表格形式存儲數據，使得數據的組織、操作和分析變得簡單高效。本文將深入探討R數據框…

閱讀更多...

論文閱讀筆記：《Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation》

論文閱讀筆記：《Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation》

論文閱讀筆記：《Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation》1.背景與動機2.核心貢獻3.方法詳解4.實驗結果與貢獻主體代碼算法整體邏輯CVPR25 github 一句話總結： CCFS基于組合范式（軌跡匹配選擇真實圖像&…

閱讀更多...

【Linux系統】詳解，進程控制

【Linux系統】詳解，進程控制

前言： 上文我們講到了Linux中的虛擬空間地址，知道了一個進程對應一個虛擬地址空間，虛擬空間地址與物理地址之間通過頁表映射....【Linux】虛擬地址空間-CSDN博客本文我們來講一講Linux系統是如何控制進程的！ 如果喜歡本期文章&am…

閱讀更多...

Matplotlib（五）- 繪制子圖

Matplotlib（五）- 繪制子圖

文章目錄一、子圖概述1. 子圖介紹2. 子圖布局2.1 網格布局2.2 自由布局二、繪制等分區域子圖1. 使用 plt.subplot() 繪制子圖示例：繪制多個子圖示例：工業月度同比情況2. 使用 plt.subplots() 繪制子圖示例：繪制多個子圖示例：部分國…

閱讀更多...

C++中互斥鎖、共享鎖深度解析

C++中互斥鎖、共享鎖深度解析

一，互斥鎖互斥鎖（Mutex，全稱 Mutual Exclusion）是并發編程中用于保護共享資源的核心同步機制。它通過確保同一時間僅有一個線程訪問臨界區（Critical Section），解決多線程環境下的數據競爭和不一…

閱讀更多...

Qt中的QWebSocket 和 QWebSocketServer詳解：從協議說明到實際應用解析

Qt中的QWebSocket 和 QWebSocketServer詳解：從協議說明到實際應用解析

前言本篇圍繞 QWebSocket 和 QWebSocketServer，從協議基礎、通信模式、數據傳輸特點等方面展開，結合具體接口應用與實戰案例進行說明。在實時網絡通信領域，WebSocket 技術以其獨特的全雙工通信能力，成為連接客戶端與服務器的重要…

閱讀更多...

機器學習 —— 決策樹

機器學習 —— 決策樹

機器學習 —— 決策樹（Decision Tree）詳細介紹決策樹是一種直觀且易于解釋的監督學習算法，廣泛應用于分類和回歸任務。它通過模擬人類決策過程，將復雜問題拆解為一系列簡單的判斷規則，最終形成類似 “樹” 狀的結構。以…

閱讀更多...

車規MCU軟錯誤防護技術的多維度分析與優化路徑

車規MCU軟錯誤防護技術的多維度分析與優化路徑

摘要：隨著汽車電子技術的飛速發展，微控制單元（MCU）在汽車電子系統中的應用日益廣泛。然而，大氣中子誘發的單粒子效應（SEE）對MCU的可靠性構成了嚴重威脅。本文深入探討了軟錯誤防護技術在車規MCU…

閱讀更多...

原生微信小程序實現語音轉文字搜索---同聲傳譯

原生微信小程序實現語音轉文字搜索---同聲傳譯

效果展示 ![在這里插入圖片描述](https://i-blog.csdnimg.cn/direct/23257ce3b6c149a1bb54fd8bc2a05c68.png#pic_center 注意：引入同聲傳譯組件請看這篇文章 1.search.wxml <view class"search-page"><navigation-bar title"搜索" …

閱讀更多...

Wireshark安裝過程缺失vc_runtimeMinimum_x64.msi文件，安裝 Visual C++ Redistributable

Wireshark安裝過程缺失vc_runtimeMinimum_x64.msi文件，安裝 Visual C++ Redistributable

一、我大意了一開始是Npcap裝不上。在這個網站下的： Wireshark (kafan58.com) 安裝程序： 安裝過程： 無語死了，感覺被騙了......外網下的才是最正版的。二、外網正版下載最新的4.4.8版本Wireshark重新安裝 2.1 vc_runtime…

閱讀更多...

高通平臺Wi-Fi Display學習-- 調試 Wi-Fi Display 問題

高通平臺Wi-Fi Display學習-- 調試 Wi-Fi Display 問題

4.1 調試 WFD 性能 4.1.1 通過啟用調節器模式驗證 WFD 當系統設為調節器模式時，設備的運行時鐘將達到峰值。要在系統中啟用調節器模式，應在序列中輸入以下命令： 1. adb shell stop mpdecision 2. adb shell echo 1→/sys/devices/system/cpu/cpu1/online 3. adb shell…

閱讀更多...

5G專網與SD-WAN技術融合：某飲料智能工廠網絡架構深度解析

5G專網與SD-WAN技術融合：某飲料智能工廠網絡架構深度解析

隨著工業互聯網的快速發展，制造業正從傳統的生產模式向智能化、數字化方向轉型。某飲料智能工廠項目創新性地引入了5G專網與SD-WAN技術，形成了“連接-計算-應用-安全”的全鏈條網絡架構。本文將深入剖析這兩種技術在智能工廠中的應用場景、部署架構&…

閱讀更多...

Java項目：基于SSM框架實現的公益網站管理系統【ssm+B/S架構+源碼+數據庫+畢業論文+答辯PPT+遠程部署】

Java項目：基于SSM框架實現的公益網站管理系統【ssm+B/S架構+源碼+數據庫+畢業論文+答辯PPT+遠程部署】

摘要現代經濟快節奏發展以及不斷完善升級的信息化技術，讓傳統數據信息的管理升級為軟件存儲，歸納，集中處理數據信息的管理方式。本公益網站就是在這樣的大環境下誕生，其可以幫助管理者在短時間內處理完畢龐大的數據信息&#x…

閱讀更多...

向華為學習——IPD流程體系之IPD術語

向華為學習——IPD流程體系之IPD術語

第一章 IPD體系 1.1集成產品開發IPD Integrated Product Development,IPD是一種領先的、成熟的產品開發的管理思想和管理模式。它是根據大量成功的產品開發管理實踐總結出來的，并被大量實踐證明的高效的產品開發模式。通過IPD，可建立起基于市場和客戶需求驅動的集成產品開…

閱讀更多...

落霞歸雁：從自然之道到“存內計算”——用算法思維在芯片里開一條“數據高速航道”

落霞歸雁：從自然之道到“存內計算”——用算法思維在芯片里開一條“數據高速航道”

作者落霞歸雁（CSDN首發，轉載請注明） 段落一現象：當“摩爾”老去，數據卻在狂奔過去 30 年，CPU 頻率翻了 60 倍，而 DRAM 帶寬只翻了 20 倍。算力與帶寬的剪刀差，讓“計算”變成“等…

閱讀更多...

StyleX：Meta推出的高性能零運行時CSS-in-JS解決方案

StyleX：Meta推出的高性能零運行時CSS-in-JS解決方案

簡介 StyleX 是由 Meta 開發的零運行時 CSS-in-JS 解決方案，在構建時將樣式編譯為靜態 CSS，消除運行時開銷。核心特性零運行時開銷 – 構建時編譯為靜態 CSS類型安全 – 完整的 TypeScript 支持原子化 CSS – 自動生成原子化類名，最小化…

閱讀更多...

最新文章