2025年被普遍認為是AI Agent商業化的關鍵之年,而大模型正是Agent能力的核心支撐。
當開發成本大幅降低,我們很可能看到各種垂直領域的Agent應用如雨后春筍般涌現。
技術普惠的現實意義對于廣大AI創業者和開發者來說,這無疑是個好消息。
之前只有大廠才能玩得起的大模型游戲,現在中小團隊也有了參與的機會。
開源往往能催生出最具創新性的應用。
?
6月30日,百度宣布其文心大模型4.5系列全面開源。
百度選擇開放,實際上是在為自己爭取更大的生態影響力。
2025年Agent爆發,文心4.5開源的時間點選得很巧妙。
此次百度一次性推出10款文心大模型4.5系列開源模型,在獨立自研模型數量占比、模型類型數量、參數豐富度、開源寬松度與可靠性等關鍵維度上,均處于行業領先位置。
產品地址:https://yiyan.baidu.com
閉源模型的“鍍金時代”
我們必須承認,閉源模型開啟了這場革命。
以OpenAI的GPT系列和Anthropic的Claude為代表,它們用驚人的智能水平向世界證明了大型語言模型的顛覆性潛力。
它們是規則的制定者,是性能的標桿,也是商業化的先行者。
在那個階段,開發最先進的大模型是一場資本和數據的豪賭,動輒數十億美金的訓練成本、海量的高質量數據集以及頂尖的人才儲備,構筑了一道普通玩家難以逾越的護城河。
這種模式在商業上無可厚非,它確保了巨額投資的回報,并允許模型所有者完全控制其技術的發展方向和安全邊界。
OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet共同定義了行業標桿,它們在通用推理、用戶體驗和功能完善度上達到了令人矚目的高度 。
特別是Anthropic的Claude系列,憑借其獨特的“Constitutional AI”理念,強調與人類價值觀對齊,并在企業級應用上展現出獨到之處 。
其Claude 3.5 Sonnet在研究生水平推理(GPQA)、編碼能力(HumanEval)等多個基準測試中超越了GPT-4o,并引入了創新的“Artifacts”功能,允許用戶與AI生成的圖表、代碼片段等內容進行交互式協作,這在復雜數據分析和內容創作場景中極具價值 。
與此同時,OpenAI的GPT-4o則憑借其成本效益和多功能性,成為一個可靠的“全能選手”,能夠處理從文本生成到多模態輸入的廣泛任務,為廣大開發者提供了穩定且易于集成的解決方案 。
閉源模型最初的護城河是其無可爭議的性能優勢。
GPT-4的出現,讓市場愿意為其高昂的成本和封閉的特性買單。
然而隨著DeepSeek-R1等開源模型的性能在多個關鍵基準測試上追平甚至反超 ,這條護城河正在迅速收窄。
所以,當開源大模型的一些亮點被充分驗證后,一般閉源模型會火速跟進。
無論是基礎模型的能力,還是模型功能層的設計思路上,整體上是互相借鑒的過程。
開源AI力量的崛起
當Llama已成開源往事,由DeepSeek-R1扛起模型開源大旗
R1的技術路徑:通過算法優化和架構創新,他們證明了"堆算力"并非唯一出路。
這種效率優先的思路,恰恰擊中了當前AI發展的痛點——不是每家公司都有錢燒GPU集群,但每家公司都需要AI能力。
這種"技術普惠"策略直接引爆了華爾街的恐慌:
英偉達單日蒸發近6000億美元市值,整個AI產業鏈都在重新審視自己的商業模式。
國內千問一直秉持開源的路線,很多創業公司和產品底層都是基于Qwen進行強化學習,蒸餾,數據微調,百度也是看到了開源巨大的價值后決定正式開源,所以很期待這次文心“亮劍”。
開閉源模型對比:
而且,傳統云廠商也可以部署開源模型以更低的價格提供給初創 AI 團體或公司。
應用層開源技術棧:看不見的引擎
基礎模型無法在真空中運行。
一個豐富多樣的開源工具生態系統已經涌現,為開發穩健、可擴展的AI應用提供了必要的支撐。
-
編排框架:像LangChain和Netflix Metaflow這樣的工具,幫助開發者將大型語言模型、API和數據源像樂高積木一樣組合起來,構建復雜的應用邏輯 。
-
向量數據庫:Milvus、Weaviate等專門的向量數據庫,對于實現檢索增強生成(RAG)至關重要。
RAG讓大型語言模型能夠基于事實性的、企業專有數據進行回答的關鍵技術。
-
推理與部署:Ollama等工具使得在本地設備上部署和運行大型語言模型變得異常簡單。
-
完整的技術棧:一個典型的現代開源AI應用,其技術棧可能包括用于前端的Streamlit,用于嵌入的JinaAI,用于后端的FastAPI,以及用于數據存儲的Postgres(結合pgvector擴展)。
百度文心4.5大模型,究竟有哪些料?
🌰
根據官方發布和技術社區的解析,百度此次開源的文心大模型4.5系列,絕非“輕量版”的試水,而是誠意滿滿的核心能力釋放。
文心大模型4.5開源系列針對MoE架構提出了一種創新性的多模態異構模型結構,適用于從大語言模型向多模態模型的持續預訓練范式,增強了多模態理解能力。
文心大模型4.5開源系列均使用飛槳深度學習框架進行高效訓練、推理和部署。
在大語言模型的預訓練中,模型FLOPs利用率(MFU)達到47%。
其系列模型在多個文本和多模態基準測試中達到SOTA水平,尤其在指令遵循、世界知識記憶、視覺理解和多模態推理任務上效果突出。
在文本模型方面,文心大模型4.5開源系列基礎能力強、事實準確性高、指令遵循能力強、推理和編程能力出色,在多個主流基準評測中超越友商開源模型。
在多模態模型方面,在視覺常識、多模態推理、視覺感知等主流的多模態大模型評測中優于閉源的OpenAI o1。
此外,在輕量模型上,文心4.5-21B-A3B-Base文本模型效果與同量級的友商相當。
官方詳細介紹地址:
https://mp.weixin.qq.com/s/BVQzYwcnpDzUAWvRzP5g_g
百度的這一步棋,精準而狠辣。
對于百度而言,很簡單,我猜他們的想法是
“用AI開源換生態”
大模型開源:大廠不求速成,但求未來的“陽謀”
為什么這些不差錢的科技巨頭,紛紛選擇將自己耗費巨資研發的核心資產公之于眾?
這并非一時沖動,而是一種深思熟慮的長期戰略,一盤“陽謀”。
用社區參與構建真正的護城河
一個成功的開源模型,會迅速吸引一個龐大而忠誠的開發者社區。
這個社區會自發地為模型貢獻代碼、修復bug、開發教程、構建應用,甚至形成獨特的文化圈層。這個由全球智慧共同構建的生態系統,其生命力和迭代速度,遠非任何一家公司的閉源團隊可以比擬。
這將形成一個獨特的“AI恰飯硬核群體”,他們既是使用者,也是維護者和傳播者,這種粘性是金錢買不來的。
B端滲透的路徑
對于企業級市場,直接使用通用大模型往往不夠。
最佳實踐是“基于開源模型蒸餾 + 私有數據微調”。
企業可以在一個強大的開源基座模型上,用自己積累的行業數據進行精調,創造出最適合自身業務場景的專用模型。這既保證了數據安全(無需上傳到第三方平臺),又極大地降低了開發成本。
開源,為大廠向B端市場的“慢滲透”鋪平了道路。
后發者的追趕捷徑
對于在模型能力上稍稍落后的追趕者而言,開源是加速追趕第一梯隊的最佳策略。
將模型開放,等于借助了全球開發者的力量來幫助自己改進技術、發現問題。
憑借大廠雄厚的資金和算力底蘊,再結合開源社區的集體智慧,可以迅速縮短與最前沿模型的差距。
股價是最終的KPI
模型本身開源可能短期內無法直接創造收入,但它所創造的行業影響力、技術領導力敘事,以及生態繁榮的預期,會直接反映在資本市場上。
投資者的信心會推高公司的股價,從而帶來比直接售賣API調用遠為豐厚的資本回報。
開源和閉源,各有各的道
最初馬斯克在 OpenAI 時期的開放,到奧特曼時期商業化過渡,再到最近 OpenAI 再次轉向不完全商業化的承諾,這家頭部 AI 公司尚且在摸著石頭過河,戰略是根據自己公司優勢和外部環境決定的。
所以,即使是強如 OpenAI,也會在巨大未知的路線面前不得不進行各種探索,最終找到適合掌舵人和公司的長期路線。
各憑本事而已。
大模型的開源與閉源并不重要,“好用”才是驗證真理的唯一準則。
近期李彥宏說過這么一句話,非常贊同:
"無論開源、閉源,基礎模型只有解決現實問題,才有真實價值。"
AI 長期中期的技術發展,商業形態都存在極大的不確定性,其實可以理解這種策略的。
像 Claude,Gemini,Kimi 也都貢獻了非常多的優秀開源項目。
但對于用戶來講,持續享受到最新的 AI 能力才是最實惠的。
底層邏輯:AI從基建為王走向應用層生態
風險投資向AI應用層轉向
資本的流向是市場價值預期的最清晰指標。
在初期為基礎模型研發注入巨額資金后,風險投資(VC)的焦點正明確地轉向AI的應用層和運營層,這為本報告的核心論點提供了最有力的佐證。
數據顯示了這一戲劇性的轉變:
-
驚人的增長:2024年,全球AI應用層初創公司吸引了高達510億美元的風險投資,同比增長37%。而AI運營層(包括MLOps、數據工具等)的增長更為迅猛,融資額飆升344%,達到130億美元。
-
主導投資領域:AI相關初創公司在2024年占據了全球所有風險投資總額的近三分之一,成為最受資本青睞的賽道
-
投資者的明確目標:VC們現在明確地將目標鎖定在“生成式AI應用公司”——即那些利用第三方基礎模型來構建面向消費者或企業的專業軟件的公司 ()。他們尤其看好那些能夠利用AI顛覆傳統行業的垂直領域軟件 ()。
-
頂級機構入場:包括紅杉資本(Sequoia Capital)、安德森·霍洛維茨基金(a16z)在內的頂級VC,以及像AI Fund這樣的專項基金,都在積極地擴大其在AI應用和工具層的投資組合 。
風險投資在AI技術棧中的分布(2023-2024年)
這場開源浪潮最深遠的影響在于它將創新的重心從模型層下移到了應用層。
所以,無論是開源還是閉源,能夠根據自身優勢抓住可以抓的牌,保持在牌桌上的實力和定力。
留到最后,一起迎接 AGI 的到來。
對于百度而言,非常有希望以文心開源為基礎構建下面的完整生態: