注:此文章內容均節選自充電了么創始人,CEO兼CTO陳敬雷老師的新書《GPT多模態大模型與AI Agent智能體》(跟我一起學人工智能)【陳敬雷編著】【清華大學出版社】
清華《GPT多模態大模型與AI Agent智能體》書籍配套視頻課程【陳敬雷】
文章目錄
- GPT多模態大模型與AI Agent智能體系列八十七
- OpenAI開源大模型 GPT-OSS 開放權重語言模型解析:技術特性、部署應用及產業影響
- OpenAI GPT-OSS:開放大模型的"破局之作"
- 一、技術架構:兼顧性能與效率的"雙引擎"設計
- 二、訓練數據與安全:專業與安全的雙重保障
- 三、兩個版本:從臺式機到手機的"全設備覆蓋"
- 四、本地部署與應用:一鍵上手,無縫集成工具
- 五、產業鏈躁動:這些A股公司已"提前布局"
- 總結:AI普惠化的"關鍵一步"
- 更多技術內容
- 總結
GPT多模態大模型與AI Agent智能體系列八十七
OpenAI開源大模型 GPT-OSS 開放權重語言模型解析:技術特性、部署應用及產業影響
OpenAI GPT-OSS:開放大模型的"破局之作"
2025年8月5日,OpenAI扔下了一顆"重磅炸彈"——發布旗下自GPT-2以來首款開放權重語言模型GPT-OSS,包含gpt-oss-120b和gpt-oss-20b兩個版本。這一舉措不僅打破了OpenAI長期以來的"閉源傳統",更被業內視為AI技術向"普惠化"邁進的關鍵一步:普通用戶只需消費級設備,就能體驗到比肩商業大模型的性能。
一、技術架構:兼顧性能與效率的"雙引擎"設計
GPT-OSS的核心競爭力,首先源于其精心設計的技術架構:
-
MoE+Transformer雙架構:采用專家混合系統(MoE)的Transformer架構,讓模型能像"團隊協作"一樣,每個token僅激活部分參數(120b版本激活5.1億參數,20b版本激活3.6億參數),在保證性能的同時大幅降低硬件需求。
-
超長上下文與高效注意力:支持128k上下文長度(約25萬字),遠超多數消費級模型;同時沿用GPT-3的"交替密集+局部帶狀稀疏注意力"模式,并加入8分組多查詢注意力,既保證理解長文本的能力,又提升推理速度和內存效率。
-
超強分詞器:配套開源的o200k_harmony分詞器,作為o4-mini、gpt-4o分詞器的超集,能更精準處理多語言、專業術語(尤其STEM領域),減少語義損失。
二、訓練數據與安全:專業與安全的雙重保障
GPT-OSS在"能力"與"安全"之間做了精細平衡:
-
訓練數據側重專業領域:以STEM學科(科學、技術、工程、數學)、編程和通用知識為核心訓練方向,尤其在競賽數學、健康領域表現突出——20b版本在相關測試中已超越o3-mini。
-
全鏈路安全措施:預訓練階段嚴格過濾化學、生物、放射性和核(CBRN)相關有害數據;通過生物學、網絡安全數據專項微調評估風險;聯合三個獨立專家組對惡意微調進行"攻防測試",降低被濫用風險。
三、兩個版本:從臺式機到手機的"全設備覆蓋"
GPT-OSS的兩個版本針對性滿足不同場景需求,真正實現"讓大模型走進尋常百姓家":
版本 | 參數量 | 單token激活參數 | 最低內存需求 | 性能表現 | 適用設備 |
---|---|---|---|---|---|
gpt-oss-120b | 1170億 | 5.1億 | 80GB | 接近o4-mini,競賽編碼、工具調用優于o3-mini,部分任務超越o4-mini | 多數臺式機、高性能筆記本 |
gpt-oss-20b | 210億 | 3.6億 | 16GB | 達到/超過o3-mini,競賽數學、健康領域表現突出 | 高端消費級GPU、蘋果芯片Mac |
從實測來看,gpt-oss-20b在MacPro M4(48G內存)上的輸出速度達41.21 token/s,遠超同類消費級模型,日常聊天、文檔處理、簡單編程輔助等場景完全"無壓力"。
四、本地部署與應用:一鍵上手,無縫集成工具
GPT-OSS的"開放"不僅體現在權重,更體現在易用性上:
-
LM Studio一鍵部署:通過LM Studio桌面應用(官網可直接下載),普通用戶無需復雜配置,點擊"下載模型"后即可本地運行——下載gpt-oss-20b后,生成杭州三日游攻略、簡單代碼片段等任務響應迅速,延遲可忽略。
-
MCP服務集成實測:搭配螞蟻集團AntV開源的mcp-server-chart,可實現數據可視化工具調用。盡管模型4096 tokens的上下文限制導致25個工具同時開啟時會"超綱",但選擇性開啟后,生成游戲銷量餅圖、杭州景點地圖等任務準確率極高,結構化輸出能力突出。
五、產業鏈躁動:這些A股公司已"提前布局"
GPT-OSS的開放屬性,為產業鏈上下游帶來新機遇,相關概念股已進入市場視野:
-
南興股份:與微軟、OpenAI合作開發小鶩AIGC智能助手,支持智能聊天、身份預設等功能,正探索GPT-OSS在企業服務中的落地。
-
鼎捷數智:子公司鼎新電腦發布結合Azure OpenAI的Paas平臺"METIS",其IndepthAI智能體可基于大模型構建AI原生應用,新一代PLM系統已融合AIGC技術,GPT-OSS或進一步降低其開發成本。
-
漢王科技:依托天地大模型形成多個AAgent(智能體),落地于手寫電紙本(智能話稿整理)、血壓計(化驗報告解讀)等終端,GPT-OSS的開源特性或加速其終端智能化升級。
-
萬興科技:接入Azure OpenAI,旗下萬興超媒Agent可完成音視頻全流程創作;GPT-OSS的本地部署能力,有望解決其產品"云端依賴"問題。
-
拓爾思:深耕政務、金融等垂直領域,trsGPT系列模型需大量專業數據訓練,GPT-OSS的開源權重或為其提供"站在巨人肩膀上"的研發基礎。
總結:AI普惠化的"關鍵一步"
GPT-OSS的發布,標志著高端大模型從"閉源壟斷"走向"開放協作":16GB內存即可運行的20b版本,讓普通用戶、中小企業也能低成本享受大模型能力;而120b版本在消費級設備上的可用性,更打開了"個人AI助手"的想象空間。
盡管4096 tokens的上下文長度在復雜工具調用場景中仍顯不足,但瑕不掩瑜——隨著開源社區的迭代優化,GPT-OSS或將推動AI從"少數人的工具"變成"每個人的助手",而其背后的產業鏈機會,也值得長期關注。
更多技術內容
更多技術內容可參見
清華《GPT多模態大模型與AI Agent智能體》書籍配套視頻【陳敬雷】。
更多的技術交流和探討也歡迎加我個人微信chenjinglei66。
總結
此文章有對應的配套新書教材和視頻:
【配套新書教材】
《GPT多模態大模型與AI Agent智能體》(跟我一起學人工智能)【陳敬雷編著】【清華大學出版社】
新書特色:《GPT多模態大模型與AI Agent智能體》(跟我一起學人工智能)是一本2025年清華大學出版社出版的圖書,作者是陳敬雷,本書深入探討了GPT多模態大模型與AI Agent智能體的技術原理及其在企業中的應用落地。
全書共8章,從大模型技術原理切入,逐步深入大模型訓練及微調,還介紹了眾多國內外主流大模型。LangChain技術、RAG檢索增強生成、多模態大模型等均有深入講解。對AI Agent智能體,從定義、原理到主流框架也都進行了深入講解。在企業應用落地方面,本書提供了豐富的案例分析,如基于大模型的對話式推薦系統、多模態搜索、NL2SQL數據即席查詢、智能客服對話機器人、多模態數字人,以及多模態具身智能等。這些案例不僅展示了大模型技術的實際應用,也為讀者提供了寶貴的實踐經驗。
本書適合對大模型、多模態技術及AI Agent感興趣的讀者閱讀,也特別適合作為高等院校本科生和研究生的教材或參考書。書中內容豐富、系統,既有理論知識的深入講解,也有大量的實踐案例和代碼示例,能夠幫助學生在掌握理論知識的同時,培養實際操作能力和解決問題的能力。通過閱讀本書,讀者將能夠更好地理解大模型技術的前沿發展,并將其應用于實際工作中,推動人工智能技術的進步和創新。
【配套視頻】
清華《GPT多模態大模型與AI Agent智能體》書籍配套視頻【陳敬雷】
視頻特色: 前沿技術深度解析,把握行業脈搏
實戰驅動,掌握大模型開發全流程
智能涌現與 AGI 前瞻,搶占技術高地
上一篇:《GPT多模態大模型與AI Agent智能體》系列一》大模型技術原理 - 大模型技術的起源、思想
下一篇:DeepSeek大模型技術系列五》DeepSeek大模型基礎設施全解析:支撐萬億參數模型的幕后英雄