630,百度文心大模型4.5系列開源!真香

2025年被普遍認為是AI Agent商業化的關鍵之年,而大模型正是Agent能力的核心支撐。

當開發成本大幅降低,我們很可能看到各種垂直領域的Agent應用如雨后春筍般涌現。

技術普惠的現實意義對于廣大AI創業者和開發者來說,這無疑是個好消息。

之前只有大廠才能玩得起的大模型游戲,現在中小團隊也有了參與的機會。

開源往往能催生出最具創新性的應用。

?

6月30日,百度宣布其文心大模型4.5系列全面開源。

百度選擇開放,實際上是在為自己爭取更大的生態影響力。

2025年Agent爆發,文心4.5開源的時間點選得很巧妙。

此次百度一次性推出10款文心大模型4.5系列開源模型,在獨立自研模型數量占比、模型類型數量、參數豐富度、開源寬松度與可靠性等關鍵維度上,均處于行業領先位置。

Image

產品地址:https://yiyan.baidu.com

Image

閉源模型的“鍍金時代”

我們必須承認,閉源模型開啟了這場革命。

以OpenAI的GPT系列和Anthropic的Claude為代表,它們用驚人的智能水平向世界證明了大型語言模型的顛覆性潛力。

它們是規則的制定者,是性能的標桿,也是商業化的先行者。

在那個階段,開發最先進的大模型是一場資本和數據的豪賭,動輒數十億美金的訓練成本、海量的高質量數據集以及頂尖的人才儲備,構筑了一道普通玩家難以逾越的護城河。

這種模式在商業上無可厚非,它確保了巨額投資的回報,并允許模型所有者完全控制其技術的發展方向和安全邊界。

OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet共同定義了行業標桿,它們在通用推理、用戶體驗和功能完善度上達到了令人矚目的高度 。

特別是Anthropic的Claude系列,憑借其獨特的“Constitutional AI”理念,強調與人類價值觀對齊,并在企業級應用上展現出獨到之處 。

其Claude 3.5 Sonnet在研究生水平推理(GPQA)、編碼能力(HumanEval)等多個基準測試中超越了GPT-4o,并引入了創新的“Artifacts”功能,允許用戶與AI生成的圖表、代碼片段等內容進行交互式協作,這在復雜數據分析和內容創作場景中極具價值 。

Image

與此同時,OpenAI的GPT-4o則憑借其成本效益和多功能性,成為一個可靠的“全能選手”,能夠處理從文本生成到多模態輸入的廣泛任務,為廣大開發者提供了穩定且易于集成的解決方案 。

閉源模型最初的護城河是其無可爭議的性能優勢。

GPT-4的出現,讓市場愿意為其高昂的成本和封閉的特性買單。

然而隨著DeepSeek-R1等開源模型的性能在多個關鍵基準測試上追平甚至反超 ,這條護城河正在迅速收窄。

所以,當開源大模型的一些亮點被充分驗證后,一般閉源模型會火速跟進。

無論是基礎模型的能力,還是模型功能層的設計思路上,整體上是互相借鑒的過程。

開源AI力量的崛起

當Llama已成開源往事,由DeepSeek-R1扛起模型開源大旗

R1的技術路徑:通過算法優化和架構創新,他們證明了"堆算力"并非唯一出路。

這種效率優先的思路,恰恰擊中了當前AI發展的痛點——不是每家公司都有錢燒GPU集群,但每家公司都需要AI能力。

這種"技術普惠"策略直接引爆了華爾街的恐慌:

英偉達單日蒸發近6000億美元市值,整個AI產業鏈都在重新審視自己的商業模式。

Image

國內千問一直秉持開源的路線,很多創業公司和產品底層都是基于Qwen進行強化學習,蒸餾,數據微調,百度也是看到了開源巨大的價值后決定正式開源,所以很期待這次文心“亮劍”。

開閉源模型對比:

Image

而且,傳統云廠商也可以部署開源模型以更低的價格提供給初創 AI 團體或公司。

應用層開源技術棧:看不見的引擎

基礎模型無法在真空中運行。

一個豐富多樣的開源工具生態系統已經涌現,為開發穩健、可擴展的AI應用提供了必要的支撐。

  • 編排框架:像LangChain和Netflix Metaflow這樣的工具,幫助開發者將大型語言模型、API和數據源像樂高積木一樣組合起來,構建復雜的應用邏輯 。

  • 向量數據庫:Milvus、Weaviate等專門的向量數據庫,對于實現檢索增強生成(RAG)至關重要。

RAG讓大型語言模型能夠基于事實性的、企業專有數據進行回答的關鍵技術。

  • 推理與部署:Ollama等工具使得在本地設備上部署和運行大型語言模型變得異常簡單。

  • 完整的技術棧:一個典型的現代開源AI應用,其技術棧可能包括用于前端的Streamlit,用于嵌入的JinaAI,用于后端的FastAPI,以及用于數據存儲的Postgres(結合pgvector擴展)。

百度文心4.5大模型,究竟有哪些料?

🌰

根據官方發布和技術社區的解析,百度此次開源的文心大模型4.5系列,絕非“輕量版”的試水,而是誠意滿滿的核心能力釋放。

文心大模型4.5開源系列針對MoE架構提出了一種創新性的多模態異構模型結構,適用于從大語言模型向多模態模型的持續預訓練范式,增強了多模態理解能力。

文心大模型4.5開源系列均使用飛槳深度學習框架進行高效訓練、推理和部署。

在大語言模型的預訓練中,模型FLOPs利用率(MFU)達到47%。

其系列模型在多個文本和多模態基準測試中達到SOTA水平,尤其在指令遵循、世界知識記憶、視覺理解和多模態推理任務上效果突出。

在文本模型方面,文心大模型4.5開源系列基礎能力強、事實準確性高、指令遵循能力強、推理和編程能力出色,在多個主流基準評測中超越友商開源模型。

在多模態模型方面,在視覺常識、多模態推理、視覺感知等主流的多模態大模型評測中優于閉源的OpenAI o1。

此外,在輕量模型上,文心4.5-21B-A3B-Base文本模型效果與同量級的友商相當。

Image

官方詳細介紹地址:

https://mp.weixin.qq.com/s/BVQzYwcnpDzUAWvRzP5g_g

百度的這一步棋,精準而狠辣。

對于百度而言,很簡單,我猜他們的想法是

“用AI開源換生態”

Image

Image

大模型開源:大廠不求速成,但求未來的“陽謀”

為什么這些不差錢的科技巨頭,紛紛選擇將自己耗費巨資研發的核心資產公之于眾?

這并非一時沖動,而是一種深思熟慮的長期戰略,一盤“陽謀”。

用社區參與構建真正的護城河

一個成功的開源模型,會迅速吸引一個龐大而忠誠的開發者社區。

這個社區會自發地為模型貢獻代碼、修復bug、開發教程、構建應用,甚至形成獨特的文化圈層。這個由全球智慧共同構建的生態系統,其生命力和迭代速度,遠非任何一家公司的閉源團隊可以比擬。

這將形成一個獨特的“AI恰飯硬核群體”,他們既是使用者,也是維護者和傳播者,這種粘性是金錢買不來的。

Image

B端滲透的路徑

對于企業級市場,直接使用通用大模型往往不夠。

最佳實踐是“基于開源模型蒸餾 + 私有數據微調”。

企業可以在一個強大的開源基座模型上,用自己積累的行業數據進行精調,創造出最適合自身業務場景的專用模型。這既保證了數據安全(無需上傳到第三方平臺),又極大地降低了開發成本。

開源,為大廠向B端市場的“慢滲透”鋪平了道路。

Image

后發者的追趕捷徑

對于在模型能力上稍稍落后的追趕者而言,開源是加速追趕第一梯隊的最佳策略。

將模型開放,等于借助了全球開發者的力量來幫助自己改進技術、發現問題。

憑借大廠雄厚的資金和算力底蘊,再結合開源社區的集體智慧,可以迅速縮短與最前沿模型的差距。

股價是最終的KPI

模型本身開源可能短期內無法直接創造收入,但它所創造的行業影響力、技術領導力敘事,以及生態繁榮的預期,會直接反映在資本市場上。

投資者的信心會推高公司的股價,從而帶來比直接售賣API調用遠為豐厚的資本回報。

開源和閉源,各有各的道

最初馬斯克在 OpenAI 時期的開放,到奧特曼時期商業化過渡,再到最近 OpenAI 再次轉向不完全商業化的承諾,這家頭部 AI 公司尚且在摸著石頭過河,戰略是根據自己公司優勢和外部環境決定的。

Image

所以,即使是強如 OpenAI,也會在巨大未知的路線面前不得不進行各種探索,最終找到適合掌舵人和公司的長期路線。

各憑本事而已。

大模型的開源與閉源并不重要,“好用”才是驗證真理的唯一準則。

近期李彥宏說過這么一句話,非常贊同:

"無論開源、閉源,基礎模型只有解決現實問題,才有真實價值。"

AI 長期中期的技術發展,商業形態都存在極大的不確定性,其實可以理解這種策略的。

像 Claude,Gemini,Kimi 也都貢獻了非常多的優秀開源項目。

但對于用戶來講,持續享受到最新的 AI 能力才是最實惠的。

底層邏輯:AI從基建為王走向應用層生態

風險投資向AI應用層轉向

資本的流向是市場價值預期的最清晰指標。

在初期為基礎模型研發注入巨額資金后,風險投資(VC)的焦點正明確地轉向AI的應用層和運營層,這為本報告的核心論點提供了最有力的佐證。

數據顯示了這一戲劇性的轉變:

  • 驚人的增長:2024年,全球AI應用層初創公司吸引了高達510億美元的風險投資,同比增長37%。而AI運營層(包括MLOps、數據工具等)的增長更為迅猛,融資額飆升344%,達到130億美元。

  • 主導投資領域:AI相關初創公司在2024年占據了全球所有風險投資總額的近三分之一,成為最受資本青睞的賽道

  • 投資者的明確目標:VC們現在明確地將目標鎖定在“生成式AI應用公司”——即那些利用第三方基礎模型來構建面向消費者或企業的專業軟件的公司 ()。他們尤其看好那些能夠利用AI顛覆傳統行業的垂直領域軟件 ()。

  • 頂級機構入場:包括紅杉資本(Sequoia Capital)、安德森·霍洛維茨基金(a16z)在內的頂級VC,以及像AI Fund這樣的專項基金,都在積極地擴大其在AI應用和工具層的投資組合 。

風險投資在AI技術棧中的分布(2023-2024年)

Image

這場開源浪潮最深遠的影響在于它將創新的重心從模型層下移到了應用層。

所以,無論是開源還是閉源,能夠根據自身優勢抓住可以抓的牌,保持在牌桌上的實力和定力。

留到最后,一起迎接 AGI 的到來。

對于百度而言,非常有希望以文心開源為基礎構建下面的完整生態:

Image

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87087.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87087.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87087.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數據結構:遞歸:斐波那契數列(Fibonacci Sequence)

目錄 什么是斐波那契數列? 用遞歸推導Fibonacci 復雜度分析 用迭代推導Fibonacci 復雜度分析 遞歸優化:記憶化遞歸(Memoized Recursion) 復雜度分析 什么是斐波那契數列? 斐波那契數列(Fibonacci Seq…

ArcGIS Pro利用擦除工具,矢量要素消除另一矢量部分區域

選擇“System Toolboxes”→“Analysis Tools.tbx”→“Overlay”→“Erase(擦除)”。 原始 擦除后

Linux: network: 性能 pause

最近看到一個問題,是關于網卡的throughput的性能問題,后來在ethtool-S里看到有pause的counter,這個也是網絡性能問題的一個分析方向。算是學到了新的知識點。 $ grep -i -e 2025- -e pause ethtool*ens2f1np1 | grep -v -e ": 0\$" | headtail 4====

目標檢測系列(五)已標注數據集(yolo格式)導入labelstudio繼續標注

目錄 1、labelstudio安裝 2、yolo(txt)轉json 3、COCO轉yolo(僅針對coco格式標注信息) 4、設置環境變量并啟動labelstudio 5、進入label studio創建工程并設置任務標簽 6、安裝http-server并啟動文件映射服務 7、進入label studio導入json文件即可 1、labelstudio安裝 …

pytorch底層原理學習--Libtorch

libtorch libtorch 是 PyTorch 的 C 實現版本,可以認為所有的pytorch底層都是由c實現,而pytorch的所有C實現就叫libtorch,也就是我們在pytorch官網getstart頁面下載的cpytorch版本。我們用python寫的pytorch神經網絡代碼都會通過pybind11將p…

TCP 三次握手協商 MSS 前,如何確定 MSS 值(附 Linux 內核源碼)

文章目錄 一、SYN總結影響 SYN MSS 的因素 二、SYNACK總結影響 SYNACK MSS 的因素 結合 Linux 內核源碼 一、SYN 總結影響 SYN MSS 的因素 套接字選項 TCP_MAXSEG路由選項 advmss出口 MTU 減去 40(TCP 和 IP 的固定首部大小)IPV4_MAX_PMTU - 40(同上) 二、SYNACK 總結影響 SY…

掃描電子顯微鏡(SEM)夏令營面試基礎題及答案

第二期表征問題SEM,后續會陸續更新其他表征 SEM和XRD一樣,都是表征里面很常見的手段,基本上看論文這兩個都是必不可少的 對于這部分內容,理解記憶>死記硬背,到時會問起來回答個大概就行, 像上…

Leetcode力扣解題記錄--第49題(map)

題目鏈接:49. 字母異位詞分組 - 力扣(LeetCode) 題目描述 給你一個字符串數組,請你將 字母異位詞 組合在一起。可以按任意順序返回結果列表。 示例 1: 輸入: strs ["eat", "tea", "tan", &quo…

AI賦能智慧餐飲:Spring Boot+大模型實戰指南

? 餐飲行業三大痛點 高峰期點餐擁堵:300人餐廳,15個服務員仍排長隊 后廚浪費嚴重:食材損耗率高達25%,成本失控 顧客體驗同質化:復購率不足30% 🚀 智慧餐飲解決方案架構 🔥 核心模塊代碼實現…

用鴻蒙打造真正的跨設備數據庫:從零實現分布式存儲

網羅開發 (小紅書、快手、視頻號同名) 大家好,我是 展菲,目前在上市企業從事人工智能項目研發管理工作,平時熱衷于分享各種編程領域的軟硬技能知識以及前沿技術,包括iOS、前端、Harmony OS、Java、Python等…

【Docker基礎】Docker數據卷:數據卷的作用與使用場景

目錄 1 Docker數據卷概述 1.1 什么是數據卷 1.2 數據卷的核心特性 3 數據卷與綁定掛載的對比 2.1 技術對比 2.2 選擇建議 3 數據卷的核心作用 3.1 數據持久化 3.2 數據共享 3.3 備份與遷移 4 數據卷使用場景詳解 4.1 數據庫應用 4.2 日志集中管理 5 數據卷操作全…

安裝GPU版本的Pytorch

前言 Pytorch是深度學習框架,在工作中我們一般是使用GPU版本的Pytorch,提高運行效率 安裝GPU版本的Pytorch需要先安裝CUDA和CUANN這兩個GPU環境 如果準備安裝GPU版本的Pytorch安裝同志沒有安裝CUDA和CUANN,請看我上一篇文章 RTX5070顯卡安裝CUDA和CUDNN-CSDN博客 目錄 安裝…

微信小程序學習筆記

微信小程序學習筆記 一、文件和目錄結構介紹 小程序包括:主體文件、頁面文件 主體文件: app.js:小程序入口文件app.json:小程序的全局配置文件app.wxss:小程序的全局樣式 頁面文件:是每個頁面所需的文…

抓包之通過wireshark抓ping包

寫在前面 本文看下如何抓ping包。 1:正文 因為ping使用的是icmp協議,所以這里我們可以通過過濾icmp協議來進行抓包: 其中對于icmp請求報文狀態碼是8,如下: 響應狀態碼是0: 如下圖是一個局域網環境中…

大文件分片上傳 — nodejs

上傳文件路由: var express require(express); var router express.Router(); const multer require(multer); const fs require(fs); const path require(path);// 確保上傳目錄存在 const uploadDir path.join(__dirname, ../backend/uploads); const temp…

HarmonyOS File和base64字符串轉換

1. HarmonyOS File和base64字符串轉換 1.1. Base64 1.1.1. Base64認知 Base64 是一種基于64個 ASCII 字符來表示二進制數據的表示方法,這個64個不同的字符為: ??(1)大、小寫字母(A– Z、a–z)。52個 ?…

【NodeJs】【npm】npm安裝electron報錯

解決問題 npm安裝electron報錯一般來說是鏡像源的問題。 electron的鏡像源與一般的 vue 之類的鏡像源地址不一樣需要單獨配置。 npm讀取的全局配置一般是在 C:\Users\{用戶}\.npmrc 這個配置文件中。 如果你找不到你的配置文件可以執行如下命令, # 執行后會直接用txt打開你的…

植物small RNA靶基因預測軟件,psRobot

psRoto軟件安裝 網址 http://omicslab.genetics.ac.cn/psRobot/downloads.php下載和安裝 wget http://omicslab.genetics.ac.cn/psRobot/program/WebServer/psRobot_v1.2.tar.gz # tar -zxvf psRobot_v1.2.tar.gz # cd psRobot_v1.2 ## ./configure make make installpsRot…

翻譯服務器

基于UDP編程博客里的回顯服務器代碼,翻譯服務只需要改process方法即可 所以我們可以創建一個UdpDictServer直接繼承UdpEchoServer然后重寫process方法 在重寫的方法中完成翻譯的過程 代碼: package network;import java.io.IOException; import java.net.SocketException; …

初等變換 線性代數

初等變換 介紹了三種初等變換的操作。 初等矩陣 初等矩陣是干嘛的呢?實際上初等矩陣就是我們矩陣的初等操作,每一個對矩陣的初等變換操作都相當于乘上一個初等矩陣。 左乘初等矩陣就相當于對行進行初等操作,右乘則相當于對列進行初等操作。…