提示:本篇文章 1300 +字,閱讀時間:5分鐘。
前言
6 月 30 日,百度正式開源文心大模型 4.5 系列,這一動作不僅兌現了 2 月發布會上的技術承諾,更以 10 款全維度模型矩陣刷新了國內開源模型的技術邊界。從學術研究到產業落地,此次開源通過 “框架 + 模型” 雙層開放的技術架構,為 AI 開發者提供了從底層訓練到上層應用的完整解決方案。
開源模型矩陣:參數量級與技術類型的全覆蓋
本次開源涵蓋從 0.3B 至 424B 參數量的 10 款模型,包含 47B、3B 激活參數的混合專家(MoE)模型以及 0.3B 參數的稠密型模型等,并實現預訓練權重和推理代碼完全開源。 開發者可在飛槳星河社區、HuggingFace 等平臺便捷下載部署,同時開源模型 API 服務已在百度智能云千帆大模型平臺上線!
技術架構突破:多模態與高效訓練的雙重革新
百度早在今年 2 月就預告了文心大模型 4.5 系列的推出及開源計劃,并如期兌現。在獨立自研模型數量占比、模型類型數量、參數豐富度、開源寬松度與可靠性等關鍵維度,均處于行業領先水平。
在技術突破上,針對 MoE 架構提出多模態異構模型結構,適用于從大語言模型向多模態模型的持續預訓練,在提升文本任務性能的同時,顯著增強多模態理解能力。依托多模態混合專家模型預訓練、高效訓練推理框架和針對模態的后訓練等關鍵技術,基于飛槳深度學習框架,大語言模型預訓練中模型 FLOPs 利用率(MFU)高達 47%。
性能實測:多任務場景下的 SOTA 表現
(一)文本模型:邏輯推理與知識準確性雙優
文心大模型 4.5 開源系列在文本模型方面表現卓越, 基礎能力強、事實準確性高、指令遵循與推理編程能力出色。在多個主流基準評測中超越 DeepSeek-V3、Qwen3 等模型。例如,數學推理的 SVAMP 測試中成績達 90.2,常識問答的 MMLU 測試中以 78.4 的高分領先。
(二)多模態模型:視覺理解超越閉源標桿
在多模態模型領域, 文心大模型 4.5 開源系列具備卓越視覺感知能力,在視覺常識、多模態推理、視覺感知等主流評測中,表現優于閉源的 OpenAI o1。如在 DROP 測試中,多模態推理得分達 89.4。
(三)輕量級模型:小參數實現大能力
輕量模型上, 文心 4.5-21B-A3B-Base 文本模型效果與同量級的 Qwen3 相當;文心 4.5-VL-28B-A3B 多模態模型更是同量級中最好的多模態開源模型,與更大參數模型 Qwen2.5-VL-32B 相比也不落下風。
參考圖 | ||
---|---|---|
![]() | ![]() | ![]() |
開源生態下的技術普惠 —— 創新大門的 “金鑰匙”
文心大模型 4.5 系列的開源,標志著國內 AI 技術從 “模型競爭” 轉向 “生態共建” 的新階段。通過底層技術的開放共享,百度正推動 AI 能力從實驗室走向產業一線 —— 無論是學術研究中的模型創新,還是企業場景中的智能升級,這 10 款開源模型都將成為技術落地的 “基礎設施”。
百度文心 4.5 系列的開源,是誠意與實力的雙重彰顯,為 AI 技術的發展注入全新活力。無論你是學術研究者,還是產業開發者,都能在這 10 款開源模型中,找到開啟創新大門的 “金鑰匙”。
👉 👉 👉 傳送門 https://aistudio.baidu.com/playground