大模型筆記1——李宏毅《2025機器學習》第一講

本篇筆記內容

1、學習本節課需要的前置知識

  • 了解大模型的訓練過程:預訓練、后訓練、強化學習(2024年生成式AI導論前8講)
  • 了解基礎機器學習、深度學習概念(如transformer)(2021年機器學習課程)

2、本節課的大綱

  • 大模型有怎樣的行為:
    • 思考reasoning
    • 使用工具(deepreasearch、使用瀏覽器、詢問人類反饋)
  • 運作機制:
    • 人類給定輸入,大模型給輸出(輸入輸出可以是文字、語言、圖片)
    • 生成式AI的基本原理——文字接龍
      • 根據給定的一串token,決定下一個token
      • 輸入給定的token,確定輸出的一串token,哪個token的概率最大。因為有概率的參與,所以一模一樣的輸入也會有不一樣的輸出。
      • 為什么需要深度學習?不精準的比喻是,深度學習可以把輸入拆解成為多個步驟,因此相較于一次性計算所有數據,深度學習多層計算拆開后減少運算量,比較簡單。
  • 模型是怎樣產生出來的
    • 神經網絡包含“架構”和“參數”兩部分,其中架構包含如“神經網絡有多少層”等,是人為定義好的,一般說工程師調參就是調整架構。(能調整的架構參數,就叫做超參數。參數,則模型是需要通過訓練資料學習的)
    • 找出參數過程,就是模型訓練,需要大量語料

零、前置準備&課程大綱

一、有什么行為

1)大模型會推理

2)大模型會使用工具

  • deep research
  • 使用瀏覽器(操作電腦 open ai operator)
  • 詢問人類反饋

二、運作機制

1)給定輸入,有輸出

輸入輸出都可以是很復雜的東西,比如文字、圖片、聲音

2)生成式AI的基本原理——文字接龍

給定一串token,決定下一個token

輸入給定的token,輸出一串概率分布,確定輸出的一串token,哪個token的概率最大。因為有概率的參與,所以一模一樣的輸入也會有不一樣的輸出。

為什么需要深度學習,不精準的比喻是,深度學習可以把輸入拆解成為多個步驟,因此相較于一次性計算,深度學習比較簡單。

如果深度學習的層數不夠,也可以用前一個深度學習的輸出作為下一個深度學習的輸入

三、模型是怎樣產生出來的

神經網絡包含“架構”和“參數”兩部分

其中架構包含如“神經網絡有多少層”等,是人為定義好的。

一般說工程師調參就是調整架構。

能調整的架構參數,就叫做超參數。參數,則是模型需要通過訓練資料學習的。

找出參數過程,就是模型訓練

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/92097.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/92097.shtml
英文地址,請注明出處:http://en.pswp.cn/web/92097.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CSS scrollbar-width:輕松定制滾動條寬度的隱藏屬性

在前端設計中,滾動條往往是一個容易被忽略的細節。默認的滾動條樣式常常與頁面設計格格不入,尤其是寬度 —— 過寬的滾動條會擠占內容空間,過窄又可能影響用戶操作。而 CSS 的scrollbar-width屬性,就像一把 “精細的尺子”&#x…

小迪23年-28~31-js簡單回顧

前端-js開發 課堂完結后欲復習鞏固也方便后續-重游-故寫此篇 從實現功能過渡到涉及的相關知識點 知識點 1、 JS 是前端語言,是可以被瀏覽器“看到”的,當然也可以被修改啊,被瀏覽器禁用網頁的 JS 功能啊之類的。所以一般都是前后端分離開發&…

JavaScript 概述

JavaScript 是一種高級、解釋型編程語言,主要用于網頁開發,使其具備動態交互功能。它是網頁三大核心技術之一(HTML、CSS、JavaScript),能夠直接嵌入 HTML 頁面并在瀏覽器中執行。核心特性動態弱類型語言 JavaScript 是…

Mermaid流程圖可視化系統:基于Spring Boot與Node.js的三層架構實現

什么是Mermaid?系統架構設計 三層架構 overview架構交互流程 核心組件詳解 1. Spring Boot后端2. Node.js中間層3. 前端界面 功能實現 1. 節點和關系管理2. 流程圖渲染3. 主題切換4. 導出功能 使用指南 啟動步驟頁面操作 總結與展望 什么是Mermaid? Mermaid流程圖可視化系統…

R 數據框:高效數據處理與分析的利器

R 數據框:高效數據處理與分析的利器 引言 在數據科學和統計分析領域,R語言因其強大的數據處理能力和豐富的統計模型而備受推崇。R數據框(data frame)是R語言中一種重要的數據結構,它以表格形式存儲數據,使得數據的組織、操作和分析變得簡單高效。本文將深入探討R數據框…

論文閱讀筆記:《Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation》

論文閱讀筆記:《Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation》1.背景與動機2.核心貢獻3.方法詳解4.實驗結果與貢獻主體代碼算法整體邏輯CVPR25 github 一句話總結: CCFS基于組合范式(軌跡匹配選擇真實圖像&…

【Linux系統】詳解,進程控制

前言: 上文我們講到了Linux中的虛擬空間地址,知道了一個進程對應一個虛擬地址空間,虛擬空間地址與物理地址之間通過頁表映射....【Linux】虛擬地址空間-CSDN博客 本文我們來講一講Linux系統是如何控制進程的! 如果喜歡本期文章&am…

Matplotlib(五)- 繪制子圖

文章目錄一、子圖概述1. 子圖介紹2. 子圖布局2.1 網格布局2.2 自由布局二、繪制等分區域子圖1. 使用 plt.subplot() 繪制子圖示例:繪制多個子圖示例:工業月度同比情況2. 使用 plt.subplots() 繪制子圖示例:繪制多個子圖示例:部分國…

C++中互斥鎖、共享鎖深度解析

一,互斥鎖互斥鎖(Mutex,全稱 Mutual Exclusion)是并發編程中用于保護共享資源的核心同步機制。它通過確保同一時間僅有一個線程訪問臨界區(Critical Section),解決多線程環境下的數據競爭和不一…

Qt中的QWebSocket 和 QWebSocketServer詳解:從協議說明到實際應用解析

前言 本篇圍繞 QWebSocket 和 QWebSocketServer,從協議基礎、通信模式、數據傳輸特點等方面展開,結合具體接口應用與實戰案例進行說明。 在實時網絡通信領域,WebSocket 技術以其獨特的全雙工通信能力,成為連接客戶端與服務器的重要…

機器學習 —— 決策樹

機器學習 —— 決策樹(Decision Tree)詳細介紹決策樹是一種直觀且易于解釋的監督學習算法,廣泛應用于分類和回歸任務。它通過模擬人類決策過程,將復雜問題拆解為一系列簡單的判斷規則,最終形成類似 “樹” 狀的結構。以…

車規MCU軟錯誤防護技術的多維度分析與優化路徑

摘要:隨著汽車電子技術的飛速發展,微控制單元(MCU)在汽車電子系統中的應用日益廣泛。然而,大氣中子誘發的單粒子效應(SEE)對MCU的可靠性構成了嚴重威脅。本文深入探討了軟錯誤防護技術在車規MCU…

原生微信小程序實現語音轉文字搜索---同聲傳譯

效果展示 ![在這里插入圖片描述](https://i-blog.csdnimg.cn/direct/23257ce3b6c149a1bb54fd8bc2a05c68.png#pic_center 注意&#xff1a;引入同聲傳譯組件請看這篇文章 1.search.wxml <view class"search-page"><navigation-bar title"搜索" …

Wireshark安裝過程缺失vc_runtimeMinimum_x64.msi文件,安裝 Visual C++ Redistributable

一、我大意了 一開始是Npcap裝不上。 在這個網站下的&#xff1a; Wireshark (kafan58.com) 安裝程序&#xff1a; 安裝過程&#xff1a; 無語死了&#xff0c;感覺被騙了......外網下的才是最正版的。 二、外網正版 下載最新的4.4.8版本Wireshark重新安裝 2.1 vc_runtime…

高通平臺Wi-Fi Display學習-- 調試 Wi-Fi Display 問題

4.1 調試 WFD 性能 4.1.1 通過啟用調節器模式驗證 WFD 當系統設為調節器模式時,設備的運行時鐘將達到峰值。要在系統中啟用調節器模式,應 在序列中輸入以下命令: 1. adb shell stop mpdecision 2. adb shell echo 1→/sys/devices/system/cpu/cpu1/online 3. adb shell…

5G專網與SD-WAN技術融合:某飲料智能工廠網絡架構深度解析

隨著工業互聯網的快速發展&#xff0c;制造業正從傳統的生產模式向智能化、數字化方向轉型。某飲料智能工廠項目創新性地引入了5G專網與SD-WAN技術&#xff0c;形成了“連接-計算-應用-安全”的全鏈條網絡架構。本文將深入剖析這兩種技術在智能工廠中的應用場景、部署架構&…

Java項目:基于SSM框架實現的公益網站管理系統【ssm+B/S架構+源碼+數據庫+畢業論文+答辯PPT+遠程部署】

摘 要 現代經濟快節奏發展以及不斷完善升級的信息化技術&#xff0c;讓傳統數據信息的管理升級為軟件存儲&#xff0c;歸納&#xff0c;集中處理數據信息的管理方式。本公益網站就是在這樣的大環境下誕生&#xff0c;其可以幫助管理者在短時間內處理完畢龐大的數據信息&#x…

向華為學習——IPD流程體系之IPD術語

第一章 IPD體系 1.1集成產品開發IPD Integrated Product Development,IPD是一種領先的、成熟的產品開發的管理思想和管理模式。它是根據大量成功的產品開發管理實踐總結出來的,并被大量實踐證明的高效的產品開發模式。通過IPD,可建立起基于市場和客戶需求驅動的集成產品開…

落霞歸雁:從自然之道到“存內計算”——用算法思維在芯片里開一條“數據高速航道”

作者 落霞歸雁&#xff08;CSDN首發&#xff0c;轉載請注明&#xff09; 段落一 現象&#xff1a;當“摩爾”老去&#xff0c;數據卻在狂奔 過去 30 年&#xff0c;CPU 頻率翻了 60 倍&#xff0c;而 DRAM 帶寬只翻了 20 倍。算力與帶寬的剪刀差&#xff0c;讓“計算”變成“等…

StyleX:Meta推出的高性能零運行時CSS-in-JS解決方案

簡介 StyleX 是由 Meta 開發的零運行時 CSS-in-JS 解決方案&#xff0c;在構建時將樣式編譯為靜態 CSS&#xff0c;消除運行時開銷。 核心特性 零運行時開銷 – 構建時編譯為靜態 CSS類型安全 – 完整的 TypeScript 支持原子化 CSS – 自動生成原子化類名&#xff0c;最小化…