百度文心 ERNIE 4.5 開源:開啟中國多模態大模型開源新時代

百度文心 ERNIE 4.5 開源:開啟中國多模態大模型開源新時代

隨著DeepSeek-R1的橫空出示,越來越多大公司開始開源模型,像DeepSeek R1發布的時候Kimi同步開源了技術文檔,隨著R1推動著思維鏈推理技術的發展,開源社區也出現了越來越多開源推理大模型,比如前段時間開源的Qwen3,開始使用MOE架構并且能自由切換思維模式,以及Kimi也開源了一些模型,比如Kimi-VL多模態模型,也適用了思維鏈R1的方式應用到多模態大模型中。最近沖浪中,我又發現百度也開始進行開源了,6.30號的時候剛剛發布了開源模型,也就是文心大模型 ERNIE 4.5系列,現在在huggingface已經可以下載開源的權重了 https://huggingface.co/baidu。

這次百度也是真的大氣,一口氣開源了很多個模型,包括了 47B、3B 激活參數的混合專家(MoE)模型,以及 0.3B 參數的稠密型模型,共計 10 款模型,實現了預訓練權重和推理代碼的完全開源。最驚訝的是同時開源了多模態推理大模型,之前Seed-VL公開技術報告的時候我驚艷了一波,但是字節并沒有開源,百度這波開源的正是時候,而且是一個424B的大模型,也具有切換思考模模式的能力,也擁有Qwen3的語言模型能力。

同時從現有全球主流大模型開源維度上來看,現在百度開源的大模型無論是覆蓋類型以及開源模型的數量,不僅包括基礎模型,也包括多模態模型,這些都處于領先地位,并且主要的是開源協議是 Apache 協議,是開源進行商用的,依托這種趨勢,未來肯定會有更多的大模型進行開源。

這次比較有意思是的,這次百度不僅僅開源了模型權重,同時也發布了技術報告和訓練推理代碼,能夠讓我們快速的了解這次開源的文心系列 ERNIE 4.5大模型,本次大模型還針對 MoE 架構,百度提出了一種創新性的多模態異構模型結構,這種范式在保留文本任務性能的基礎上,還顯著的增強多模態理解能力;同時百度的多模態MOE預訓練和針對多模態后訓練等關鍵技術,讓他們在各個文本和多模態基準測試中脫穎而出,能夠和 Qwen3/DeepSeekV3 的一較高下,比如ERNIE 4.5在 28 個基準測試中的 20+個指標上 上超越了 DeepSeek-V3-671B-A37B-Base,達到 SOTA 水平。這也可能是為什么百度能夠開源高達424B的多模態大模型的原因,像這么大的多模態推理大模型暫時在國內還沒有人進行開源,百度不論是在技術還是開源都走在了中國的前列。

最后意思的還是ERNIE 4.5系列中的多模態后訓練模型,可支持思考,這次開源兩個模型,一個是平價版本的28B的VL大模型,一個是超大版本的424B的大模型,可以看出來文心的大模型已經在多個基準上都超過了OpenAI-o1的水準了,而且也是為數不多開源的多模態推理大模型,性能也是數一數二,未來可能會有更多的文章和開源項目來follow 文心大模型了。這一部分也是最讓我驚艷的,就算是關閉思考的模型也在通用環境中展現超強的能力,超過了Qwen2.5-VL,同樣在多個領域都達到了SOTA。

并且在海外的twitter中,我也關注到,huggingface上到 CEO、創始人和眾多工程師都對這次百度的開源一致好評,ERNIE 4.5是 DeepSeek以來中國最大的開源模型發布,同時文心的基準測試展現出很強的模型技術能力,可與Qwen3/DeepSeekv3等開源大模型競爭,并且參數量喜人,涵蓋從0.3B到424B。

這次百度開源的時候也同時開源了訓練代碼,ERNIE 4.5模型使用飛槳(PaddlePaddle)框架進行訓練,不僅僅有paddle的模型,也有pytorch模型。

同時配套一個微調的框架,也就是ERNIEKit,他 是一個面向 ERNIE 4.5 的產業級開發套件。它提供了模型訓練和壓縮功能,包括預訓練,SFT,LoRA, DPO,量化感知訓練(QAT)和訓練后量化(PTQ)等技術。

使用示例:

# Download modelhuggingface-cli download baidu/ERNIE-4.5-300B-A47B-Base-Paddle \--local-dir baidu/ERNIE-4.5-300B-A47B-Base-Paddle
# SFTerniekit train examples/configs/ERNIE-4.5-300B-A47B/sft/run_sft_wint8mix_lora_8k.yaml \model_name_or_path=baidu/ERNIE-4.5-300B-A47B-Base-Paddle
# DPOerniekit train examples/configs/ERNIE-4.5-300B-A47B/dpo/run_dpo_wint8mix_lora_8k.yaml \model_name_or_path=baidu/ERNIE-4.5-300B-A47B-Base-Paddle

于此同時還提供了基于飛槳的大模型高效部署套件FastDeploy,使用接口兼容vLLM和OpenAI協議,針對ERNIE模型進行了優化,支持low bit推理,上下文緩存等加速技術,這里就不過多闡述了,以下是示例代碼。

本地推理示例:

from fastdeploy import LLM, SamplingParams
prompt = "Write me a poem about large language model."sampling_params = SamplingParams(temperature=0.8, top_p=0.95)
llm = LLM(model="baidu/ERNIE-4.5-0.3B-Paddle", max_model_len=32768)
outputs = llm.generate(prompt, sampling_params)

服務部署示例:

python -m fastdeploy.entrypoints.openai.api_server \--model "baidu/ERNIE-4.5-0.3B-Paddle" \--max-model-len 32768 \--port 9904

有關詳細文檔、安裝指南和高級配置選項,請參考ERNIEKit和 FastDeploy 倉庫,這里我就不多說了。

現在大模型越來越卷了,不僅僅有開源和閉源之爭,也有中美AI之爭,OpenAI和谷歌大模型也在不斷的發布,Open AI 以前的的閉源態度發生了明顯轉變,也開始打出 “開源 + 免費” 的組合拳,還開源了Agent框架以及DeepResearch,這無不顯示中國的開源大模型的策略,已對 OpenAI 形成了強大的壓力,迫使其不得不做出改變。現在大模型在技術層面逐漸向多模態方向發展,生態層面則愈發重視開源,而這次百度文心大模型 4.5 系列的開源,是中國 AI 發展歷程中的一座重要里程碑,它向世界展示了中國 AI 的強大實力,也為中國 AI 開源生態的發展注入了強大動力。百度其實也一直在路上,百度有自研paddle飛槳框架以及千帆大模型平臺,這次又開源了ERNIE 4.5,性價比拉滿,同時給開源社區注入活力,后續我會嘗試體驗文心模型,看看github上的代碼,共建開源社區,為開源貢獻一份力量。

參考

  • ERNIE 4.5 模型系列正式開源:https://ernie.baidu.com/blog/zh/posts/ernie4.5/
  • https://x.com/eliebakouch/status/1939512373007765666
  • https://x.com/Xianbao_QIAN/status/1939506694838714530
  • https://x.com/ClementDelangue/status/1939516209172480141

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/87472.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/87472.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/87472.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

22、企業項目管理(Project)全體系構建:從基礎框架到智能防呆的完整解決方案

項目管理能力——企業VUCA戰略落地的核心樞紐 在VUCA(烏卡時代,即VUCA時代,是指人們生活在一個不穩定性、不確定性、復雜性、模糊性的時代、境況或者世界中。vuca是volatility(易變性VUCA),uncertainty&am…

分布式定時任務:Elastic-Job-Lite

Elastic-Job-Lite 是一款由 Apache 開源的輕量級分布式任務調度框架,屬于 ShardingSphere 生態體系的一部分。它專注于分布式任務調度,支持彈性伸縮、分片處理、高可用等特性,且不依賴中心化架構。 一、基礎 (一)核心特…

記錄一次生產環境ActiveMQ無法啟動的問題

這次遇到一個問題,是ActiveMQ無法啟動的,跟以往的現象不一樣。這次是在服務器重啟后出異常。 1、啟動ActiveMQ時提示:activemq/data/kahadb/db.data(輸入輸出錯誤),NotFoundFileException異常 2、想著不應該…

大型語言模型幻覺檢測相關綜述

背景 1.1 幻覺檢測的定義與范圍 大型語言模型(LLMs)中的幻覺檢測 是指系統性地識別由LLMs生成的事實錯誤或無意義輸出的任務,而無需依賴外部證據 [Li et al., 2024; Zhang et al., 2024]。這項任務對于確保LLM生成內容的可靠性和可信度至關…

Python爬蟲與數據可視化教程

對于經常寫爬蟲的技術來說了,可視化大大的提高工作效率,可以讓獲取的數據更直觀的展示在面前,下面我將通過具體實操給大家展示下多種可視化具體教程,希望能都幫助大家。 下面是一個完整的Python爬蟲和數據可視化解決方案&#xff…

【GHS】Green Hills軟件MULTI-IDE的安裝教程

前言:MULTI-IDE作為一款Green Hills開發的支持C/C、Ada等語言的嵌入式開發環境,由于其優異的性能,所以在汽車電子軟件的開發中占有重要地位。但是這款IDE需要付費使用,對于個人學習而言不太友好,所以這里介紹一款PJ版本…

Web攻防-文件上傳黑白名單MIMEJS前端執行權限編碼解析OSS存儲分域名應用場景

知識點: 1、WEB攻防-文件上傳-前端&黑白名單&MIME&文件頭等 2、WEB攻防-文件上傳-執行權限&解碼還原&云存儲&分站等 3、WEB攻防-文件上傳-JS提取&特定漏洞&第三方編輯器 4、WEB攻防-文件上傳-思維導圖形成 常規文件上傳&#xff1a…

Odoo系統大型業務優化實戰

目錄 背景說明ORM與模型優化數據量處理策略接口與報表優化系統架構優化監控與診斷工具項目實戰總結(案例)后續優化建議性能優化檢查清單總結 一、背景說明 在 Odoo 項目中,隨著業務不斷擴展,系統常常面臨如下挑戰: …

【2.4 漫畫SpringBoot實戰】

?? 漫畫SpringBoot實戰 ?? 學習目標:掌握SpringBoot企業級開發,從零到一構建現代化Java應用 ?? 目錄 SpringBoot核心特性自動配置原理Web開發實戰數據訪問與事務監控與部署?? 漫畫引言 小明: “為什么SpringBoot這么受歡迎?” 架構師老王: “SpringBoot就像全自動…

美國站群服務器的優勢和應用與選擇指南

在當今數字化時代,互聯網業務的蓬勃發展促使各類企業和個人不斷尋求高效、穩定且功能強大的網絡解決方案。美國站群服務器作為一種備受矚目的網絡基礎設施,正逐漸成為眾多從事跨境電商、搜索引擎優化(SEO)、內容分發、數據采集等業…

智能合約基礎:Solidity語法速成

目錄 智能合約基礎:Solidity語法速成引言:區塊鏈的可編程世界1. Solidity基礎語法1.1 合約結構1.2 數據類型2. 核心概念詳解2.1 可見性修飾符2.2 狀態可變性2.3 錯誤處理2.4 事件與日志3. 高級特性3.1 繼承與接口3.2 修飾器3.3 委托調用與代理合約4. 完整DeFi質押合約實現5. …

SmartDV推出先進的H.264和H.265視頻編碼器和解碼器IP

向全球市場提供靈活、高度可配置、可定制的半導體設計知識產權(IP)和驗證IP(VIP)的開發商SmartDV? Technologies近日宣布:公司現已提供即刻可用的H.264和H.265視頻編碼器和解碼器IP解決方案。針對每一種技術&#xff…

數據結構學習day8---strstr+symlink+remove+rename+link+truncate

一、strstr 1.頭文件 #include <string.h> 2.函數原型 char *strstr(const char *haystack, const char *needle);3.功能 在一個字符串haystack中查找另一個字符串needle的第一次出現&#xff0c;并返回該位置的指針&#xff0c;如果找不到&#xff0c;則返回NULL。 …

智能設備遠程管理:基于OpenAI風格API的自動化實踐

在數字化轉型的浪潮中&#xff0c;智能設備的遠程管理功能變得越來越重要。通過API接口實現對智能設備的自動化操作&#xff0c;不僅可以提高工作效率&#xff0c;還可以增強系統的靈活性和可擴展性。本文將詳細介紹如何利用Python和openai庫&#xff0c;結合一個類似OpenAI風格…

數字電路工作原理

1、數字電路的分類 2、基本結構和特點 3、電路特性 4、電路互連 5、電路選型基本原則 1、數字電路的分類 GaAs 該電路類型 速度快,功耗大,原料劇毒,至今尚未被大量應用 硅 出現了單極型 PMOS NMOS CMOS 雙極性 TTL STTL、LSTTL、ALSTTL、FTTL、LVTTL ECL MEC…

C# 進行音視頻編解碼開發

一、音視頻編解碼基礎 1.1 基本概念 音視頻編解碼是數字媒體處理的核心技術,主要涉及將原始音視頻數據進行壓縮編碼以便存儲和傳輸,以及將壓縮數據解碼為可播放的原始格式。在 C# 環境下開發音視頻編解碼器,需要先了解幾個關鍵概念: 編碼 (Encoding):將原始音視頻數據轉…

YOLOv11深度解析:Ultralytics新一代目標檢測王者的創新與實踐(附網絡結構圖+訓練/推理/導出全流程代碼詳解)

?? 一、YOLOv11為何成為新標桿? 2024年底,Ultralytics正式推出YOLOv11,在COCO數據集上以更少參數量(減少22%) 實現了超越YOLOv8的精度,成為邊緣設備與云端部署的新寵。其核心創新在于: 輕量化設計:深度可分離卷積(DWConv)大幅降低計算量注意力增強:C2PSA模塊提升…

live server插件vscode的配置

安裝完其實就可以直接使用了&#xff0c;一般來說不必手動配置&#xff0c;點擊右下角的go live按鈕就可以運行。默認端口是5500 好的&#xff0c;為你詳細說明如何在 VS Code 中配置 Live Server 插件。這是一個非常有用的插件&#xff0c;我們不僅會講如何安裝和使用&#x…

基于MATLAB的風力發電機無人機巡檢路徑優化研究

基于MATLAB的風力發電機無人機巡檢路徑優化研究 摘要 本文針對風力發電機無人機巡檢路徑優化問題,提出了一種基于三維參數建模與智能優化算法的解決方案。通過建立風力發電機的三維幾何模型,綜合考慮無人機的飛行約束條件和巡檢任務需求,設計了多目標優化函數,并采用改進…

經緯度哈希編碼實現方式

背景&#xff1a;在大數據數倉建設的過程中&#xff0c;有時會遇到經緯度類型的數據信息&#xff0c;但在進行關聯分析和數倉建設的時候用經緯度去關聯&#xff0c;難免不夠便捷&#xff0c;于是我們可以開發UDF使用地理經緯度信息哈希編碼的方案進行開發&#xff0c;非常有效 …