百度文心大模型 4.5 系列全面開源 英特爾同步支持端側部署

2025 年 6 月 30 日,百度如期兌現 2 月 14 日的預告,正式開源文心大模型 4.5(ERNIE 4.5)系列,涵蓋 10 款不同參數規模的模型,包括 470 億參數混合專家(MoE)模型、30 億參數 MoE 模型及 3 億參數稠密型模型,實現預訓練權重與推理代碼的完全開放。這一舉措標志著國內大模型技術向生態化、普惠化邁出關鍵一步。


開源矩陣與授權機制:兼顧商業應用與技術共享

文心大模型 4.5 系列基于 Apache License 2.0 許可發布,允許開發者進行商業使用,僅需遵守開源協議條款。此次同步開源的還有開發工具包 ERNIEKit,集成了從預訓練到部署的全流程工具:

  • 支持監督微調(SFT)、低秩適應(LoRA)、直接偏好優化(DPO)等主流訓練技術;
  • 提供量化訓練(QAT)、訓練后量化(PTQ)等壓縮方案,適配不同硬件環境。

開發者可通過飛槳星河社區、HuggingFace 平臺下載模型,百度智能云千帆大模型平臺同步提供 API 服務,降低企業接入門檻。值得關注的是,英特爾已第一時間完成對文心 4.5 端側模型的適配,實現其在酷睿 Ultra 平臺上的本地化部署,拓展了模型的應用場景。

三大技術創新:多模態融合與高效訓推突破

文心大模型 4.5 的性能提升源于三項核心技術創新:

  1. 多模態混合專家預訓練:通過文本與視覺模態聯合訓練,構建異構混合專家結構。結合多維旋轉位置編碼與專家正交性優化,使兩種模態相互促進,顯著提升文本生成、圖像理解及跨模態推理能力。
  2. 高效訓推框架:采用異構混合并行策略與多層級負載均衡技術,配合 FP8 混合精度訓練,大幅提升預訓練吞吐量;推理階段通過多專家協同量化算法,實現 4-bit/2-bit 近無損量化,結合動態預填充與解碼分離部署,優化資源利用率。
  3. 模態針對性后訓練:針對不同任務場景進行精細化調優 —— 語言模型聚焦通用理解與生成,多模態模型強化視覺 - 語言關聯,并支持 “思考模式”(強化推理)與 “非思考模式”(強化感知)切換,兼顧效率與能力。
評測表現:參數更優卻實現性能反超

在權威基準測試中,文心 4.5 系列展現出 “小參數、高性能” 的特點:

  • 470 億參數模型(ERNIE-4.5-300B-A47B):在 28 項基準測試中的 22 項超越 DeepSeek-V3-671B,尤其在泛化能力、邏輯推理和知識密集型任務中優勢顯著;在 IFEval、SimpleQA 等指令遵循與知識類測試中排名業界第一。
  • 210 億參數模型(ERNIE-4.5-21B-A3B):參數規模僅為 Qwen3-30B 的 70%,卻在 BBH(多任務基準)、CMATH(數學推理)等測試中表現更優,實現效率與性能的平衡。
  • 多模態模型(ERNIE-4.5-VL):在 “思考模式” 下,MathVista、MMMU 等高難度視覺推理基準成績突出;“非思考模式” 則保持 CV-Bench 等感知任務的高準確率。輕量級 280 億參數版本相較于 Qwen2.5-VL 系列,在多數測試中性能相當甚至更優,且支持雙模式切換。

🌟?DMXAPI 全維度解決方案,重構 AI 開發體驗?🌟

🚀?多模型集成:一個密鑰開啟全球智能生態
  • 只需1 個 API Key,即可無縫串聯?GPT、Claude、Gemini、Llama?等全球頂尖大模型,打破技術壁壘與平臺限制。
💰?財務合規:專業服務為商業落地護航
  • 企業級合規支持:無論是企業用戶的項目采購,還是個人開發者的技術服務,均可提供正規發票,財務流程透明合規。

👉?登錄 DMXAPI 官網,體驗 “一個平臺管理所有 AI 能力” 的高效與便捷!
點擊鏈接:立即探索 DMXAPI

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87306.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87306.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87306.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Google AI Edge Function Calling: Android 端模型也能調用工具函數

大家好,我是拭心。 上篇文章我們了解了如何在 Android 手機上實現 RAG。這篇文章我們來聊聊端上大模型應用開發的核心概念:Function Calling(函數調用能力,簡寫為 FC)。 Function Calling 本質上是讓大模型在回答過程…

模型調試實用技巧 (Pytorch Lightning)

【PL 基礎】模型調試實用技巧 摘要1. 設置斷點2. 快速運行所有模型代碼一次3. 縮短 epoch 長度4. 運行健全性檢查5. 打印 LightningModule 權重摘要6. 打印輸入輸出層尺寸 摘要 本文總結了6種實用的模型調試技巧:1)通過設置斷點逐行檢查代碼;…

計算機網絡(四)網際層IP

目錄 一、概念 ?編輯 二、網際層和數據鏈路層的關系? 三、IP地址的基礎認識 四、IP地址的分類 五、無分類地址CIDR 六、子網掩碼 七、為什么要分離網絡號和主機號 八、公有IP和私有IP ?編輯 九、IP地址與路由控制 十、IP分片和重組 十一、IPv6 十二、IP協議…

Java--多態--向上轉型--動態綁定機制--斷點調試--向下轉型

目錄 1. 向上轉型 2. 向下轉型 3. java的動態綁定機制: 4. Object類講解 5. 斷點調試 1. 向上轉型 提前:倆個對象(類)存在繼承關系 本質:父類的引用指向了子類的對象 語法:父類 類型 引用名 new…

Python爬蟲實戰:研究urllib 庫相關技術

1. 引言 1.1 研究背景與意義 互聯網每天產生海量數據,如何高效獲取和利用這些數據成為重要研究方向。網頁爬蟲作為自動獲取網絡信息的核心技術,在市場調研、輿情分析、學術研究等領域具有廣泛應用。Python 憑借其簡潔語法和豐富庫支持,成為爬蟲開發的首選語言。 1.2 相關…

【機器學習賦能的智能光子學器件系統研究與應用】

目前在Nature和Science雜志上發表的機器學習與光子學結合的研究主要集中在以下幾個方面: 1.光子器件的逆向設計:通過機器學習,特別是深度學習,可以高效地進行光子器件的逆向設計,這在傳統的多參數優化問題中尤為重要。…

Codeforces Round 1034 (Div. 3)

比賽鏈接如下:https://codeforces.com/contest/2123 A. Blackboard Game Initially, the integers from 00 to n?1 are written on a blackboard. In one round, Alice chooses an integer a on the blackboard and erases it;then Bob chooses an integer b on …

微電網系列之微電網的孤島運行

個人主頁:云納星辰懷自在 座右銘:“所謂堅持,就是覺得還有希望!” 微電網的孤島運行 微電網具有并網和孤島兩種運行模式,由于孤島運行模式下,分布式電源為微電網內部負荷提供頻率和電壓支撐,由…

JsonCpp的核心類及核心函數使用匯總

文章目錄 JsonCpp的核心類及核心函數使用匯總一、前言二、JsonCpp 核心類介紹三、Value 類函數解析1. 值獲取函數(asxxx 系列 )2. 值類型判斷函數(isxxx 系列 )3. 數組操作函數4. 對象操作函數5. 運算符重載6. 迭代器7. JSON 轉化…

Qt寫入excel

1.tableView導出到excel 點擊導出函數按鈕、發送sendMessage信號(信號名稱,對象,數據) void HydroelectricPowerPluginImpl::exportTableViewSelectedRows(QTableView* tableView, QWidget* parent) {if (!tableView || !tableVie…

OSCP - Proving Grounds - DC - 1

主要知識點 drupal 7 RCEfind SUID提權 具體步驟 nmap起手,80端口比較有意思,安裝了 Drupal 7 Starting Nmap 7.94SVN ( https://nmap.org ) at 2024-12-17 14:23 UTC Nmap scan report for 192.168.57.193 Host is up (0.00087s latency). Not shown: 65531 cl…

仿小紅書交流社區(微服務架構)

文章目錄 framework - 平臺基礎設施starter - jacksoncommonexceptionresponseutil starter - content 全局上下文distributed - id - generate - 分布式 IdSnowflake - 基于雪花算法生成 IdSegment - 基于分段式生成 Id OSS - 對象存儲KV - 短文本存儲筆記評論 user - 用戶服務…

大模型開源技術解析 4.5 的系列開源技術解析:從模型矩陣到產業賦能的全棧突破

提示:本篇文章 1300 字,閱讀時間:5分鐘。 前言 6 月 30 日,百度正式開源文心大模型 4.5 系列,這一動作不僅兌現了 2 月發布會上的技術承諾,更以 10 款全維度模型矩陣刷新了國內開源模型的技術邊界。從學術…

[6-02-01].第05節:配置文件 - YAML配置文件語法

SpringBoot學習大綱 一、YAML語法 1.1.概述: 1.YAML是一種數據序列化格式;2.它是以數據為中心3.容易閱讀,容易與腳本語言交互,如下圖所示: 1.2.基本語法 1.key: value:kv之間有空格2.使用縮進表示層級關系3.縮進時…

FPGA學習

一、module : 定義: 是構建數字系統的基本單元,用于封裝電路的結構和行為。它可以表示從簡單的邏輯門到復雜的處理器等任何硬件組件。 1. module 的基本定義 module 模塊名 (端口列表);// 端口聲明input [位寬] 輸入端口1;output [位寬] 輸出端口1;ino…

26-計組-存儲器與Cache機制

一、存儲器與局部性原理 1. 局部性原理 基礎概念: 時間局部性:一個存儲單元被訪問后,短時間內可能再次被訪問(例如循環變量)。空間局部性:一個存儲單元被訪問后,其附近單元可能在短時間內被訪…

I/O 線程 7.3

前言 以下: 概述 1.基礎 2.代碼演示 3.練習 4.分析題 1.基礎 一、線程基礎概念 并發執行原理 通過時間片輪轉實現多任務"并行"效果 實際為CPU快速切換執行不同線程 線程 vs 進程 線程共享進程地址空間,切換開銷更小 進程擁有獨立資源&am…

MySQL JSON數據類型完全指南:從版本演進到企業實踐的深度對話

📊 MySQL JSON數據類型完全指南:從版本演進到企業實踐的深度對話 在當今數據驅動的時代,MySQL作為最受歡迎的關系型數據庫之一,不斷演進以滿足現代應用的需求。JSON數據類型的引入,讓MySQL在保持關系型數據庫優勢的同時…

BI × 餐飲行業 | 以數據應用重塑全鏈路業務增長路徑

在競爭激烈的餐飲行業中,數據已成為企業保持競爭力的關鍵資產。通過深入分析顧客數據,餐飲企業能夠洞察消費者的需求和偏好,從而提供更加精準和個性化的服務。此外,利用數據優化業務管理,降低成本,并提高運…

【學習線路】機器學習線路概述與內容關鍵點說明

文章目錄 零、機器學習的企業價值一、基礎概念1. 機器學習定義2. 學習類型3. 學習范式 二、核心算法與技術1. 監督學習2. 無監督學習3. 模型評估與優化 三、深度學習與神經網絡1. 神經網絡基礎2. 深度學習框架3. 應用場景 四、工具與實踐1. 數據處理2. 模型部署3. 機器學習的生…