【源力覺醒 創作者計劃】文心開源大模型ERNIE-4.5-0.3B-Paddle私有化部署保姆級教程及技術架構探索

一起來輕松玩轉文心大模型吧👉一文心大模型免費下載地址: https://ai.gitcode.com/theme/1939325484087291906

前言

2025年6月30日,百度正式開源文心大模型4.5系列(ERNIE 4.5),涵蓋10款不同參數規模的模型,包括了47B(470億)、3B(30億)激活參數的異構混合專家架構多模態MoE大模型,及0.3B(3億)參數的稠密型模型,預訓練權重與推理代碼均完全開放。除此之外還提供完整的ERNIEKit微調工具鏈和FastDeploy推理框架,兼容主流生態,適用于各種業務場景。

目前,這些模型已可在GitCode代碼托管平臺進行下載,博主這里也是第一時間對文心開源模型ERNIE-4.5-0.3B-Paddle進行了私有化部署測評。

文心模型開源系列

二、文心開源大模型私有化部署

從GitCode平臺可以看到,百度此次開源的文心大模型有十多款,形成了從0.3B到424B參數的梯度覆蓋,不僅包含文本模型還包含了視覺多模態模型(VLM),除最小的0.3B 模型外,其余模型都采用異構多模態MoE(專家混合模型:Mixture of Experts)架構。

在這里插入圖片描述

這里咱們選擇的是ERNIE-4.5-0.3B-Paddle大模型,只包含了3億參數量,屬于一個輕量化模型,可以進行本地部署,對顯卡要求沒有300B或者28、21B參數的模型(需要80G顯卡)要求高。
在這里插入圖片描述

1、準備好系統鏡像和顯卡

博主這里準備是英偉達的4090顯卡(24G顯存),用來跑ERNIE-4.5-0.3B-Paddle的輕量化模型是足夠的。
在這里插入圖片描述

操作鏡像,這里準備的是Ubuntu 20.04系統,加上必要的環境CUDA12\Python3.10等,如下圖所示:

在這里插入圖片描述

2、下載huggingface-cli

huggingface-cli 是 Hugging Face 官方提供的命令行工具,自帶完善的下載模型功能

pip install -U huggingface_hub
3、如果下載受限制,可以設置以下國內環境變量,
2. 設置環境變量
Linux
export HF_ENDPOINT=https://hf-mirror.comWindows Powershell
$env:HF_ENDPOINT = "https://hf-mirror.com"建議將上面這一行寫入 ~/.bashrc。

4、下載大模型

我們選擇的是ERNIE-4.5-0.3B-Paddle大模型

在這里插入圖片描述

下載命令:

#cDownload Model
huggingface-cli download baidu/ERNIE-4.5-0.3B-Paddle --local-dir baidu/ERNIE-4.5-0.3B-Paddle

在這里插入圖片描述

5、下載 paddlepaddle-gpu

#注意這里的版本需要根據自己的cuda的版本去定python3 -m pip install paddlepaddle-gpu==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
Looking in indexes: https://www.paddlepaddle.org.cn/packages/stable/cu118/

6、下載fastdeploy-gpu

FastDeploy的安裝按這個文檔,不要直接pip install,有要求,你的顯卡選擇對應命令,
下載地址:https://paddlepaddle.github.io/FastDeploy/get_started/installation/nvidia_gpu/


#1、如果是 For SM86/89 architecture GPUs(e.g A10/4090/L20/L40):執行這個命令:
python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-86_89/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple#2、如果是For SM80/90 architecture GPUs(e.g A30/A100/H100/):執行這個命令
python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-80_90/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

在這里插入圖片描述

7、運行模型

python -m fastdeploy.entrypoints.openai.api_server \--model baidu/ERNIE-4.5-0.3B-Paddle \--port 8180 \--metrics-port 8181 \--engine-worker-queue-port 8182 \--max-model-len 32768 \--max-num-seqs 32

8、成功運行提示

Launching metrics service at http://0.0.0.0:8181/metrics

在這里插入圖片描述

到這一步,咱們的模型就算部署成功了,咱們接下來,寫一個測試腳本,看看模型提供的API接口能否調用成功。

9、編寫腳本測試調用 test.py

test.py 測試腳本如下所示:

import openai
host = "0.0.0.0"
port = "8180"
client = openai.Client(base_url=f"http://{host}:{port}/v1", api_key="null")response = client.chat.completions.create(model="null",messages=[{"role": "system", "content": "你是一位電商售后客服專家,擅長處理客戶售后服務問題,對產品使用體驗、物流配送、售后服務、退換貨流程和日常保養等都有豐富的實踐經驗。"},{"role": "user", "content": "請問一般的產品售后有哪些保障,如何退換貨?."},],stream=True,
)
for chunk in response:if chunk.choices[0].delta:print(chunk.choices[0].delta.content, end='')
print('\n')

在這里插入圖片描述

10、大模型回答

運行命令:python test.py

在這里插入圖片描述

大模型調用成功請求日志
在這里插入圖片描述

到這里我們的大模型就私有化部署成功了。

對于算力有限的中小開發者,0.3B參數的稠密型模型可降低部署門檻,MoE模型則能滿足企業級復雜任務的需求。這種分層供給思路,讓不同資源條件的使用者都能找到適配的工具。

三、文心開源大模型官方Benchmark(基準測試)對比

因為算力有限,博主這里找到百度官方來做的基準測試圖,我們可以看到文心4.5系列21B和30B的多模態大模型在Benchmark測評上與其他開源模型相比,優秀的效果體現。

大模型的Benchmark(基準測試)是用于評估和比較大型機器學習模型(如GPT、DeepSeek、PaLM等)性能的一系列標準化任務、數據集和評價指標,常用來作為評價模型質量的標準之一。

在這里插入圖片描述

四、文心開源大模型(ERNIE 4.5)核心技術架構探索

與常規的單模態MoE不同,此次百度開源的ERNIE 4.5模型是一種異構混合型,也就是通過“分而治之”策略提升模型性能的人工智能架構:將多個不同類型的專家模塊集成在一起,每個輸入僅激活部分相關的專家模塊,從而在不顯著增加計算量的前提下大幅提升模型容量。

我們選擇一個ERNIE-4.5-21B-A3B-Base-Paddle,21b參數的開源模型的工程目錄點擊進去查看,如下圖所示
在這里插入圖片描述

文心開源大模型(ERNIE 4.5)核心技術包含以下幾點:

1、異構多模態MoE架構:

異構多模態:
多模態:模型能“看懂”圖片、“聽懂”語音、“讀懂”文字,還能把三者結合起來理解(比如看到一張“貓在沙發上”的圖片,能生成對應的文字描述)。
異構:不同任務由不同的“專家模塊”處理,比如文本任務由“語言專家”負責,圖片任務由“視覺專家”負責,避免“一刀切”導致的效率低下。

MoE(專家混合模型):
原理:模型內部有多個“專家”(類似不同領域的專家),輸入數據時,系統會自動分配給最擅長的專家處理。
優勢:避免單一模型“什么都做但都不精”的問題,同時通過動態激活專家,減少計算量,提升效率。

2、多模態混合專家模型預訓練

通過模態隔離路由和異構專家并行策略,實現文本與視覺模態的聯合訓練,避免模態間干擾

3、ERNIE 4.5的架構設計理念分析

  1. 專家分工:三類專家各司其職
    文本專家:專注處理語言任務(如翻譯、寫文章、代碼生成)。
    視覺專家:優化圖片/視頻處理(如識別物體、分析場景)。
    共享專家:捕捉跨模態的通用特征(比如文字和圖片的關聯性)。

  2. 動態路由:智能分配任務
    門控網絡:相當于“任務調度員”,根據輸入內容(文本/圖片/視頻)自動選擇最合適的專家組合。
    稀疏激活:每個任務只激活少量專家(比如處理文本時,主要用文本專家,少量用共享專家),減少計算量。

  3. 效率優化:又快又省
    自適應分辨率:視覺專家支持任意尺寸圖片輸入,避免裁剪導致的細節丟失。
    混合精度訓練:用更低的計算資源訓練更大模型,成本降低但性能不降。
    專家并行:分布式訓練中,專家模塊分布在不同設備,提升訓練速度。

4、 對比傳統模型:ERNIE 4.5的優勢

  • ERNIEKit開發套件:覆蓋微調(SFT)、對齊(DPO)到量化的全流程開發。

  • FastDeploy部署工具:解決多硬件平臺高效推理問題,降低部署門檻。

維度傳統模型ERNIE 4.5
處理模態單一模態(如只能處理文本)多模態(文本+圖片+視頻)
計算效率高(可能浪費資源)低(動態激活專家)
專業性泛泛而談各領域專家精準處理
部署難度高(需復雜調優)低(配套工具鏈支持)

五、項目總結

百度開源文心4.5系列,不僅以多模態架構創新、高效訓練體系構建及先進量化技術突破,彰顯其在人工智能領域的技術領導力,更通過開源戰略的深度實踐,為全球大模型技術生態注入普惠動能。此次開源猶如為智能革命裝上渦輪引擎,當技術民主化的浪潮沖破產業壁壘,真正受益的將是扎根開源沃土的萬千創新者——他們以效率為刃,正在智能時代的畫布上勾勒出前所未有的創新圖景。這場由技術普惠驅動的變革,不僅重構了AI開發范式,更在產業升級的深水區開辟出一條由開放創新引領的智能進化之路。

文心是百度自主研發的產業級知識增強大模型,以創新性的知識增強技術為核心,從單模態大模型到跨模態、從通用基礎大模型到跨領域、跨行業持續創新突破,構建了模型層、工具與平臺層,百度開源文心大模型這一動作,大幅降低人工智能開發和應用門檻,加快人工智能大規模產業化進程并拓展人工智能技術邊界。

一起來輕松玩轉文心大模型吧👉一文心大模型免費下載地址: https://ai.gitcode.com/theme/1939325484087291906

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/88072.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/88072.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/88072.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

大模型面試:如何解決幻覺問題

在大模型面試中回答“如何解決幻覺”問題時,需要展現你對問題本質的理解、技術方案的掌握以及工程實踐的洞察。以下是一個結構化的回答框架和關鍵點,供你參考:回答框架:問題理解 -> 解決方案 -> 總結 1. 明確問題&#xff0…

matlab實現五自由度機械臂阻抗控制下的力跟蹤

五自由度機械臂阻抗控制下的力跟蹤,可以實現對力的跟蹤反饋,基于MATLAB的機器人工具箱 eyebot.m , 767 zuakang_wailiraodong.m , 2568 colormp.mat , 682

excel日志表介紹

在Excel中制作“日志表事物”(可理解為記錄事務的日志表格),通常用于系統性追蹤事件、任務、操作或數據變化。以下從表格設計、核心要素、制作步驟、函數應用及場景案例等方面詳細說明,幫助你高效創建和使用事務日志表。 一、日志…

汽車信息安全 -- SHE密鑰更新小細節

之前我們把SHE密鑰更新流程做了梳理,汽車信息安全 -- SHE 密鑰更新流程 但在實際做SHE Emulation的時候還是發現了問題,例如如果想更新SHE Key ID等于30,會如何影響M1-M5的值呢?。 今天就聊聊關于幾家對于SHE Key的管理。 1. N…

Spring Boot配置優先級完全指南:實戰解析覆蓋規則

一、結論Spring Boot 中,位置越靠后優先級越高,外部配置壓倒內部配置,命令行參數擁有最高優先權。案例: 在一次生產事故中,某團隊通過 application-prod.properties 將服務端口設為 9000,但某運維人員在啟動…

嵌入式數據庫sqlite測試程序

繼上篇對嵌入式數據庫sqlite的移植和注意項,以及使用命令行測試之后,本篇對其進行了更進一步的程序測試,以備近期在項目中使用。測試程序及說明如下:/**************** 相關函數說明 ******************/ /* (1)sqlite3_open的函…

【學習篇】SQL復雜查詢學習

要求:能對千萬行級別的大表優化讀寫效率。 難點:如何創建千萬行級別的大表 MySQL數據庫的高效查詢不僅依賴于合理的表結構和索引設計,還需要掌握高級查詢技巧和性能優化方法。 數據表與數據表之間關系三種:實體之間關系 多對多…

Sequential Predictive Modeling of Clinical Trial Outcome with Meta-Learning解讀

SPOT(Sequential Predictive Modeling of Clinical Trial Outcome with Meta-Learning)模型是用于臨床試驗結果預測的模型, 借鑒了模型無關元學習(MAML,Model-Agnostic Meta-Learning)的框架,將模型參數分為全局共享參數和任務特定參數,以平衡跨任務泛化與任務內適配:…

優先選擇列表而非數組及泛型類型的使用

數組與泛型的核心差異 協變性與不變性 數組采用協變(covariant)類型規則:若Sub是Super的子類型,則數組類型Sub[]也是Super[]的子類型。這種設計允許以下代碼通過編譯: Object[] objectArray = new Long[1]; // 編譯通過 objectArray[0

自動化Prompt生成平臺的研發體系設計

一份輕松不啰嗦的自動化Prompt平臺研發攻略 📑 目錄 一、項目背景二、平臺整體架構設計三、核心功能模塊解析四、自動化流程設計五、樣式與跨平臺規范六、總結與展望 一、項目背景 在大模型應用爆發的今天,不寫Prompt的工程師,正在變成“寫…

[Swarm] 上下文變量 | 接入function功能調用 | Mcp

第3章:上下文變量 歡迎回到swarm! 在前兩章中,我們學習了作為對話指揮者的Swarm框架和具備指令與技能的專用AI角色智能體。(智能體就相當于是給用戶問題 已經寫好了的提示詞,在用戶提問時自動加入,以此來給用戶更好的…

【Unity開發】Unity實現第一人稱視角與第三人稱視角切換功能

一、效果展示 第三人稱視角:固定攝像機,無任何操作 第一人稱視角:用戶可以通過wsad進行前后左右移動,qe進行上升下降操作 不同視角之間切換會有一個過渡動畫,切換第一視角的初始位置始終為原點(0,0,0&am…

2025全球數字經濟大會—云智算安全論壇暨第三屆“SecGo論壇”成功召開!共筑安全新生態

2025年7月3日,由全球數字經濟大會組委會主辦,中國信息通信研究院、中國通信標準化協會承辦的全球數字經濟大會—云智算安全論壇暨第三屆“SecGo論壇”在京召開。北京市經濟和信息化局副局長顧瑾栩、中國通信標準化協會副理事長兼秘書長代曉慧、中國信通院…

KingbaseES聚焦產品上線:金倉數據庫在線體驗平臺上線,開啟數據庫實踐新征程

KingbaseES聚焦產品上線:金倉數據庫在線體驗平臺上線,開啟數據庫實踐新征程KingbaseES 在線體驗平臺是為數據庫使用者、開發者、架構師及 DBA 打造的輕量化實踐平臺,無需本地安裝數據庫環境,通過瀏覽器即可快速上手,降…

LLMs之DeepSeek:AI模型市場深度分析:DeepSeek的挑戰與機遇,模型市場份額、Token經濟學與未來發展

LLMs之DeepSeek:AI模型市場深度分析:DeepSeek的挑戰與機遇,模型市場份額、Token經濟學與未來發展 導讀:該文章主要分析了中國大語言模型DeepSeek R1發布150天后的市場表現、Token經濟學的影響以及AI模型市場的競爭格局。文章指出&…

服裝零售企業跨區域運營難題破解方案

在服裝零售行業,本地化業務系統因承載庫存、銷售等核心數據,成為眾多企業的選擇。然而對于門店分布廣、規模較大的服裝銷售商而言,總部系統與各地門店的遠程連接卻面臨挑戰:員工遠程辦公效率低、POS機數據同步滯后、跨區域監管難度…

- 思考小記

對于 分布式系統,我還是抱有敬畏之心的,因為其內容過于龐大;我在學習基礎編程的時候走過一個最大的彎路就是過度追求技術而忽視了基礎編碼能力,當時在學習springboot的時候,覺得那些新內容都是那么新奇高大上&#xff…

裝備制造數字孿生底座平臺

在《中國制造2025》和《“十四五”智能制造發展規劃》的推動下,數字孿生技術被7次重點提及,成為裝備制造業智能化升級的核心戰略。從航空航天到重型機械,從設計驗證到運維優化,數字孿生底座平臺正通過“虛實映射”與“實時交互”&…

Redis構建緩存服務器

環境信息: redis-master----192.168.12.135 redis-slave-1-----192.168.12.136 redis-slave-2-----192.168.12.137 單機版Redis 安裝Redis yum install -y gcc make jemalloc jemalloc-devel gcc-c wget tcl yum groupinstall -y "Development Tools" wge…

vscode python debugger關閉編輯器內的變量值自動顯示

vscode 的python debugger調試器的最新版本2025.8.0, 會默認把變量的值顯示出來, 如下圖所示關閉的方法: 打開vscode的settings.json, 左下角點擊齒輪按鈕, 選擇setting(設置), 然后在右上角三個按鈕最中間的那個(open setting json), 輸入 "debug.inlineValues": &q…