OpenAI開源大模型 GPT-OSS 開放權重語言模型解析:技術特性、部署應用及產業影響

注:此文章內容均節選自充電了么創始人,CEO兼CTO陳敬雷老師的新書《GPT多模態大模型與AI Agent智能體》(跟我一起學人工智能)【陳敬雷編著】【清華大學出版社】

清華《GPT多模態大模型與AI Agent智能體》書籍配套視頻課程【陳敬雷】

文章目錄

  • GPT多模態大模型與AI Agent智能體系列八十七
    • OpenAI開源大模型 GPT-OSS 開放權重語言模型解析:技術特性、部署應用及產業影響
      • OpenAI GPT-OSS:開放大模型的"破局之作"
    • 一、技術架構:兼顧性能與效率的"雙引擎"設計
    • 二、訓練數據與安全:專業與安全的雙重保障
    • 三、兩個版本:從臺式機到手機的"全設備覆蓋"
    • 四、本地部署與應用:一鍵上手,無縫集成工具
    • 五、產業鏈躁動:這些A股公司已"提前布局"
    • 總結:AI普惠化的"關鍵一步"
      • 更多技術內容
  • 總結

GPT多模態大模型與AI Agent智能體系列八十七

OpenAI開源大模型 GPT-OSS 開放權重語言模型解析:技術特性、部署應用及產業影響

OpenAI GPT-OSS:開放大模型的"破局之作"

2025年8月5日,OpenAI扔下了一顆"重磅炸彈"——發布旗下自GPT-2以來首款開放權重語言模型GPT-OSS,包含gpt-oss-120b和gpt-oss-20b兩個版本。這一舉措不僅打破了OpenAI長期以來的"閉源傳統",更被業內視為AI技術向"普惠化"邁進的關鍵一步:普通用戶只需消費級設備,就能體驗到比肩商業大模型的性能。

一、技術架構:兼顧性能與效率的"雙引擎"設計

GPT-OSS的核心競爭力,首先源于其精心設計的技術架構:

  • MoE+Transformer雙架構:采用專家混合系統(MoE)的Transformer架構,讓模型能像"團隊協作"一樣,每個token僅激活部分參數(120b版本激活5.1億參數,20b版本激活3.6億參數),在保證性能的同時大幅降低硬件需求。

  • 超長上下文與高效注意力:支持128k上下文長度(約25萬字),遠超多數消費級模型;同時沿用GPT-3的"交替密集+局部帶狀稀疏注意力"模式,并加入8分組多查詢注意力,既保證理解長文本的能力,又提升推理速度和內存效率。

  • 超強分詞器:配套開源的o200k_harmony分詞器,作為o4-mini、gpt-4o分詞器的超集,能更精準處理多語言、專業術語(尤其STEM領域),減少語義損失。

二、訓練數據與安全:專業與安全的雙重保障

GPT-OSS在"能力"與"安全"之間做了精細平衡:

  • 訓練數據側重專業領域:以STEM學科(科學、技術、工程、數學)、編程和通用知識為核心訓練方向,尤其在競賽數學、健康領域表現突出——20b版本在相關測試中已超越o3-mini。

  • 全鏈路安全措施:預訓練階段嚴格過濾化學、生物、放射性和核(CBRN)相關有害數據;通過生物學、網絡安全數據專項微調評估風險;聯合三個獨立專家組對惡意微調進行"攻防測試",降低被濫用風險。

三、兩個版本:從臺式機到手機的"全設備覆蓋"

GPT-OSS的兩個版本針對性滿足不同場景需求,真正實現"讓大模型走進尋常百姓家":

版本參數量單token激活參數最低內存需求性能表現適用設備
gpt-oss-120b1170億5.1億80GB接近o4-mini,競賽編碼、工具調用優于o3-mini,部分任務超越o4-mini多數臺式機、高性能筆記本
gpt-oss-20b210億3.6億16GB達到/超過o3-mini,競賽數學、健康領域表現突出高端消費級GPU、蘋果芯片Mac

從實測來看,gpt-oss-20b在MacPro M4(48G內存)上的輸出速度達41.21 token/s,遠超同類消費級模型,日常聊天、文檔處理、簡單編程輔助等場景完全"無壓力"。

四、本地部署與應用:一鍵上手,無縫集成工具

GPT-OSS的"開放"不僅體現在權重,更體現在易用性上:

  • LM Studio一鍵部署:通過LM Studio桌面應用(官網可直接下載),普通用戶無需復雜配置,點擊"下載模型"后即可本地運行——下載gpt-oss-20b后,生成杭州三日游攻略、簡單代碼片段等任務響應迅速,延遲可忽略。

  • MCP服務集成實測:搭配螞蟻集團AntV開源的mcp-server-chart,可實現數據可視化工具調用。盡管模型4096 tokens的上下文限制導致25個工具同時開啟時會"超綱",但選擇性開啟后,生成游戲銷量餅圖、杭州景點地圖等任務準確率極高,結構化輸出能力突出。

五、產業鏈躁動:這些A股公司已"提前布局"

GPT-OSS的開放屬性,為產業鏈上下游帶來新機遇,相關概念股已進入市場視野:

  • 南興股份:與微軟、OpenAI合作開發小鶩AIGC智能助手,支持智能聊天、身份預設等功能,正探索GPT-OSS在企業服務中的落地。

  • 鼎捷數智:子公司鼎新電腦發布結合Azure OpenAI的Paas平臺"METIS",其IndepthAI智能體可基于大模型構建AI原生應用,新一代PLM系統已融合AIGC技術,GPT-OSS或進一步降低其開發成本。

  • 漢王科技:依托天地大模型形成多個AAgent(智能體),落地于手寫電紙本(智能話稿整理)、血壓計(化驗報告解讀)等終端,GPT-OSS的開源特性或加速其終端智能化升級。

  • 萬興科技:接入Azure OpenAI,旗下萬興超媒Agent可完成音視頻全流程創作;GPT-OSS的本地部署能力,有望解決其產品"云端依賴"問題。

  • 拓爾思:深耕政務、金融等垂直領域,trsGPT系列模型需大量專業數據訓練,GPT-OSS的開源權重或為其提供"站在巨人肩膀上"的研發基礎。

總結:AI普惠化的"關鍵一步"

GPT-OSS的發布,標志著高端大模型從"閉源壟斷"走向"開放協作":16GB內存即可運行的20b版本,讓普通用戶、中小企業也能低成本享受大模型能力;而120b版本在消費級設備上的可用性,更打開了"個人AI助手"的想象空間。

盡管4096 tokens的上下文長度在復雜工具調用場景中仍顯不足,但瑕不掩瑜——隨著開源社區的迭代優化,GPT-OSS或將推動AI從"少數人的工具"變成"每個人的助手",而其背后的產業鏈機會,也值得長期關注。

更多技術內容

更多技術內容可參見
清華《GPT多模態大模型與AI Agent智能體》書籍配套視頻【陳敬雷】。
更多的技術交流和探討也歡迎加我個人微信chenjinglei66。

總結

此文章有對應的配套新書教材和視頻:

【配套新書教材】
《GPT多模態大模型與AI Agent智能體》(跟我一起學人工智能)【陳敬雷編著】【清華大學出版社】
新書特色:《GPT多模態大模型與AI Agent智能體》(跟我一起學人工智能)是一本2025年清華大學出版社出版的圖書,作者是陳敬雷,本書深入探討了GPT多模態大模型與AI Agent智能體的技術原理及其在企業中的應用落地。
全書共8章,從大模型技術原理切入,逐步深入大模型訓練及微調,還介紹了眾多國內外主流大模型。LangChain技術、RAG檢索增強生成、多模態大模型等均有深入講解。對AI Agent智能體,從定義、原理到主流框架也都進行了深入講解。在企業應用落地方面,本書提供了豐富的案例分析,如基于大模型的對話式推薦系統、多模態搜索、NL2SQL數據即席查詢、智能客服對話機器人、多模態數字人,以及多模態具身智能等。這些案例不僅展示了大模型技術的實際應用,也為讀者提供了寶貴的實踐經驗。
本書適合對大模型、多模態技術及AI Agent感興趣的讀者閱讀,也特別適合作為高等院校本科生和研究生的教材或參考書。書中內容豐富、系統,既有理論知識的深入講解,也有大量的實踐案例和代碼示例,能夠幫助學生在掌握理論知識的同時,培養實際操作能力和解決問題的能力。通過閱讀本書,讀者將能夠更好地理解大模型技術的前沿發展,并將其應用于實際工作中,推動人工智能技術的進步和創新。

【配套視頻】

清華《GPT多模態大模型與AI Agent智能體》書籍配套視頻【陳敬雷】
視頻特色: 前沿技術深度解析,把握行業脈搏

實戰驅動,掌握大模型開發全流程

智能涌現與 AGI 前瞻,搶占技術高地

上一篇:《GPT多模態大模型與AI Agent智能體》系列一》大模型技術原理 - 大模型技術的起源、思想
下一篇:DeepSeek大模型技術系列五》DeepSeek大模型基礎設施全解析:支撐萬億參數模型的幕后英雄

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/92459.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/92459.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/92459.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CSS--后端也有自己的CSS要學

CSS,即Cascading Style Sheets,它描述了網頁的表現與展示效果 為了演示CSS,我寫了一個簡單的index.html 為了使用控制變量法,一開始我先不寫style.css文件的內容 右鍵在默認瀏覽器里查看頁面,看看效果 1-選擇器 根據標簽名進行匹配,所以也叫元素選擇器 頁面效果: 根據…

Docker swarm 常用的命令集合

#docker swarm## 初始化單節點Swarm docker swarm init# 部署測試服務 docker service create --name web --publish 8080:80 --replicas 3 nginx:alpine# Manager節點初始化(指定IP) docker swarm init --advertise-addr 192.168.1.100# 獲取加入令牌 M…

231. 2 的冪

Problem: 231. 2 的冪 文章目錄思路解題過程復雜度Code思路 2的冪 n 的二進制只有一個1,而 n - 1的二進制則是把 n 的二進制1變0, 0變1。 例:2^24100,34-1011. 解題過程 n & n - 1 0 復雜度 時間復雜度: O(1)O(1)O(1)空間復雜度: O(1)O(1)O(1) Co…

淺嘗AI輔助C轉Verilog方法

一、常規算法模塊的開發流程日常芯片開發工作中,挺多看工作是把C語言轉verilog。例如ISP的代碼,都很先由算法進行C model的開發,驗證完性能后,輸出算法原理文檔和c代碼;數字設計接手,把C語言轉換為verilog代…

Redis分布式鎖詳解:原理、實現與實戰案例

目錄 1. 什么是分布式鎖? 分布式鎖的核心要求 2. 基于Redis的分布式鎖實現方案 (1)基礎方案:SETNX EXPIRE (2)優化方案:SET NX PX(原子性加鎖) (3&…

【能碳建設1】用AI+開源打造物聯網+能碳管理+交易SaaS系統的最短路徑實施指南

摘要 本指南為技術小白設計,目標是在最短時間內利用AI工具與開源系統,獨立完成一套物聯網平臺 + 能碳管理平臺 + 碳交易系統的SaaS最小可用版本(MVP),并可后續擴展。流程分為目標定義、技術選型、環境搭建、核心功能開發、SaaS化、多租戶、上線運維等環節,按天推進,每步…

CVPR中深度學習新范式:通用性、魯棒性與多模態的創新突破

來gongzhonghao【圖靈學術計算機論文輔導】,快速拿捏更多計算機SCI/CCF發文資訊~分享一個深度學習領域正在迅速升溫的前沿方向:通用性與魯棒性的深度神經網絡架構創新。隨著大模型在視覺、文本乃至多模態任務中的廣泛應用,體現出深…

Vue3 學習教程,從入門到精通,Vue 3 + Tailwind CSS 全面知識點與案例詳解(31)

Vue 3 Tailwind CSS 全面知識點與案例詳解一、Vue 3 核心語法知識點 1. Vue 3 基礎 創建 Vue 3 項目 使用 Vite 創建項目:npm create vuelatest # 選擇需要的特性(如 TypeScript、Vue Router)響應式數據 使用 ref 和 reactive:im…

Android中RecyclerView基本使用

一、RecyclerView 核心概念1. 基本組件關系2. 核心組件作用Adapter:數據與視圖的橋梁LayoutManager:控制布局方式(線性/網格/瀑布流)ViewHolder:緩存視圖組件ItemDecoration:添加分割線等裝飾ItemAnimator&…

A100用transformers推理gpt-oss

A100本地用transformers推理gpt-oss GPT-oss試用 gpt-oss有兩個原生配置是目前(2025-8-8)Ampere系列顯卡不支持的,分別是默認的MXFP4量化,以及Flash-attn V3。tranformers推理是比較慢的,可以用于研究模型本身&#x…

虛擬手機號工具使用

背景:注冊部分國外應用時需要國外手機號驗證,例如在注冊cursor時需要國外手機號 解決:使用虛擬手機號網頁進行驗證 https://temp-number.com/ 選擇自己需要的國家 選擇一個手機號 復制手機號到自己的app注冊頁面 并發送消息,然后…

【線程池】壓測確定線程池合適的參數

【線程池】壓測確定線程池合適的參數【一】案例說明【二】明確線程池核心參數及優化目標【1】線程池核心參數(需壓測驗證的關鍵參數)【2】優化目標【三】壓測前準備【1】環境搭建【2】線程池初始配置(基于經驗值)【3】壓測工具與監…

GPT OSS 雙模型上線,百度百舸全面支持快速部署

GPT OSS 是 OpenAI 推出的重量級開放模型,專為強推理能力、智能體任務及多樣化開發場景設計,標志著大模型在開放性與實用性上的重要突破。該系列包含兩款高性能模型:參數規模為 117B 的 GPT?OSS?120B 和 21B 的 GPT?OSS?20B。二者皆采用 …

C++高頻知識點(十七)

文章目錄81. 你對智能指針的了解82. 一元、二元仿函數的區別和使用背景一元仿函數二元仿函數83. 描述Linux下文件刪除的原理84. 什么是菱形繼承?有什么問題,怎么解決?解決菱形繼承問題85. IO多路復用是什么?selectpollepollselect…

如何優雅的使用進行參數校驗

在spring里面有一個注解 Validated可以在方法的入參里面這樣寫//方法 getActivityFlag(RequestBody Validated QueryActivityDto queryActivityDto) //參數詳情NotBlank(message "userId不能為空")private String userId;NotNull(message "storeId不能為空&q…

Java學習第一百一十部分——CI/CD

目錄 一、前言簡介 二、基本信息 三、優勢價值 四、核心流程 五、技術棧(工具矩陣) 六、最佳實踐 七、與DevOps關系 八、挑戰對策 九、使用建議 十、總結歸納 一、前言簡介 CI/CD 的本質是:通過自動化流水線,實現代碼從提…

關于 Cocoapods 使用

一、Podfile & .podspec 文件 1、Podfile 1.1. 什么是 pod 簡單來說,一個 pod 就是 xcode 里面的一個 dependency: Anyway,pod 就是第三方庫的意思。一個 pod 就是指一個第三方庫。 1.2. Podfile 有什么用 Podfile 可以理解為就是…

編程速遞:2025 年巴西 Embarcadero 會議,期待您的到來

每個英雄都有一段充滿奮斗的旅程,這段旅程引領他走向榮耀,而開發者英雄的旅程是2025年巴西Embarcadero大會的重點,以慶祝Delphi成立30周年。網站現已上線巴西Embarcadero在世界上最受期待的Delphi發展英雄會議召開前90天,推出了Em…

DevOps簡單教程應用

文章目錄概念一、環境準備二、gitlab配置三、.gitlab-ci.yml文件配置概念 Devops是一個概念,就是邊開發邊測試,能夠大大提升開發效率,本文使用pycharmgitlab實現一個簡單的DevOps流程 一、環境準備 需要一個測試環境,模擬部署&…

華為流程管理體系構建與落地 之—— 業務流程規劃【附全文閱讀】

這部分內容聚焦華為業務流程管理,詳細闡述了流程規劃、設計、運營、評估與優化的具體方法和內容,為企業構建和完善流程管理體系提供了全面的指導。流程規劃分類方法:介紹 POS、OES、OMS 等分類法,如 POS 法按規劃、運營、支持劃分…