對于“百模大戰”,幾乎所有大佬的口風都180 °大轉變了?

文 | 智能相對論

作者 | 陳泊丞

在2024世界人工智能大會暨人工智能全球治理高級別會議產業發展主論壇上,百度創始人、董事長兼首席執行官李彥宏談了些對于AI大模型的看法,語驚四座。

他先是指出,“百模大戰造成了社會資源的巨大浪費,尤其是算力的浪費。但同時也使得我們追趕世界上最先進基礎模型的能力得到了建立。”

而后又強調,“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值。”同時李彥宏也表示,要跳出移動時代的思維邏輯,避免掉入“超級應用陷阱”,不是只有10億DAU的應用才叫成功。

可以說,李彥宏的發言挺激烈的。這似乎也是第一次有大佬在這么高級別的場合去把“百模大戰”和大模型的發展攤開了說。

當然,秉持著類似觀點的,也不只是李彥宏。

金沙江創投主管合伙人朱嘯虎在6月的黑馬大課上也提到,很多創業者盲目投資AI底層技術。雖然創造了“百模大戰”的盛況,但也造成了社會資源浪費。

他強調,“很顯然,AI創業的賺錢風向,已經徹底變了。”

怎么變?

除了李彥宏、朱嘯虎之外,還有獵豹移動董事長兼CEO、獵戶星空董事長傅盛,智譜AI COO張帆、百川智能創始人王小川等大佬在不同的場合也或多或少談到了大模型行業競爭轉變的方向,能最終達成共識的關鍵點在于“場景”和“應用”。

聚焦基礎大模型的“卷”所導致的“百模大戰”似乎該喊停了,大模型的重點還是得“卷”場景應用。

大佬們在這一點上達成了共識。今年以來,大家的口風都變了!

不要過度競爭基礎大模型,該“卷”場景應用了

在過去一段時間內,美國涌向了大量專注于大模型應用開發的創業公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。

同時,像OpenAI、Anthropic這樣的大模型頭部領軍企業以及如谷歌、微軟等科技巨頭也在致力于利用開源模型或自主研發的基礎模型,開發出各種應用場景的解決方案。

GPTs的推出以及OpenAI宣稱的一系列給開發者讓利的行為,都旨在吸引更多的創業團隊參與到GPT技術的創新和應用中,從而豐富GPT生態系統,幫助OpenAI在接下來的時間內占據大模型領域在場景應用方向的優勢。

以國外大模型行業的趨勢來看,國內這些大佬們的口風轉變并非空穴來風。

目前,百度文心一言的日均調用量已經超過5億,而在兩個月前百度官方才剛剛宣布文心一言的日調用量超過2億。

期間2個月的時間,調用量就發生如此之大的變化,可見大模型要“卷”場景應用不僅僅是廠商們的推動,還有整個市場的需求已經擺上臺面,呈現出爆發式增長趨勢。

類似的信號也在阿里云的主場上釋放。

在世界人工智能大會上,阿里云CTO周靖人公布了近期通義大模型和阿里云百煉平臺的最新進展——近2個月,通義千問開源模型下載量增長2倍,突破2000萬次,阿里云百煉服務客戶數從9萬增長至23萬,漲幅超150%。

談及大模型,比起參數上的比較,現如今國內的大佬們似乎更愿意去告訴市場自家的大模型如何好用,有多少人用,接下來還能怎么用等等一系列與場景應用落地相關的事情。

而以朱嘯虎為代表的投資者們也開始在應用層去尋找大模型的投資機會。

市場的風向變了,不僅僅只是大佬的口風在變。

“超級能干”的應用在哪?

“AI時代,‘超級能干’的應用比只看DAU的‘超級應用’更重要。”在世界人工智能大會上,李彥宏試圖為接下來的大模型應用開發趨勢下一個結論。

然而,“超級能干”的應用或許理解起來并不難,市場懸而未決的問題在于這樣的應用是如何開發出來的,又是如何推向大眾?

基于現階段的行業表現,「智能相對論」認為有幾點思考值得探究。

一、在“超級能干”的應用背后,大模型技術的迭代和適配是必要的。

行業的趨勢大多殊途同歸,大模型領域在今年以來掀起的MoE架構迭代趨勢,則是代表了在技術方面大模型正為“卷”場景應用而作支撐。

如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆侖萬維的天工AI、浪潮信息的源2.0-M32、通義千問團隊發布的Qwen1.5-MoE-A2.7B等國內外大模型都采用了MoE架構。

MoE架構通過引入專家網絡(Expert Networks)和門控機制(Gating Mechanism)實現了模型的稀疏化和模塊化,在數據處理、算力資源調配、輸出結果優化等方面都有相當不錯的反饋。這為大模型的場景應用落地和推廣提供了非常關鍵的技術支持。

比如,微軟就提出了一個端到端的MoE訓練和推理解決方案DeepSpeed-MoE,其通過深度優化MoE在并行訓練中的通信,減少通信開銷,實現了高效的模型并行。此外,DeepSpeed-MoE還提出了基于微調的專家排序機制,可以根據訓練過程中專家的損失動態調整輸入樣本到專家的分配,提升效果。

二、“超級能干”的應用意味著一場更商業化的生態競爭。

技術沒問題,但商業化路徑不清晰仍然會在今天的市場面臨崩盤。日前,微軟官網更新了一條通知——“GPT Builder即將停用”。曾經掀起AI圈無數熱議與高潮的GPTs似乎正在走向敗局。

誰又能想起,當時GPTs概念橫空出世的那場發布會還被外界形容為“OpenAI的iPhone時刻”。

OpenAI本意是想借助低門檻的技術能力以及全球開發者們共同打造出一批“超級能干”的應用,結果卻因技術問題帶來的體驗瑕疵以及模糊不清的貨幣化政策,讓GPTs這一概念的商業化路徑始終走不通,最終只能“涼涼”。

“超級能干”的應用大多是建立在成熟的商業生態之上,或許全球的AI廠商都需要認清楚這一點。值得一提的,在大洋的彼岸,阿里云在2022年11月牽頭發起的開源AI模型社區剛剛斬獲2024 SAIL之星獎的魔搭ModelScope。

歷經一年多的發展,魔搭社區已成為國內規模最大、最活躍的AI模型社區,匯聚5500多款優質模型和上千數據集,為超過560萬開發者提供了模型及免費算力服務。或許,OpenAI沒能走通的生態路徑,在中國會有新的生機吧。

三、“超級能干”的應用必然萌芽于行業場景中。

朱嘯虎送給大模型創業者的忠告,“不要迷信AI,聚焦尖刀場景盡快落地。”——場景是孵化“超級能干”應用的搖籃,然而更深入地來看,也不能只看場景,最終還得看用戶反饋和價值呈現。

醫療、教育、金融、制造、交通、農業等等這些行業領域是大模型應用“高發”場景,但打造出來的智能體或解決方案究竟如何,“如人飲水,冷暖自知”罷了。

To B的項目看效率。在快遞領域,目前通過大模型來幫助處理訂單,就可以做到了“一張圖、一句話寄快遞”,不再需要其他繁瑣的流程,時間從3分多鐘縮短到19秒。而且90%以上的售后問題,也都由大模型來解決。——這樣的效率提升,才稱得上是“超級能干”。

To C的場景看用戶。此前,在高峰期,百度的高考智能體每天要回答超過兩百萬個考生的問題。對于全國1000萬的考生來說,這一比例是相當高的。——這樣的用戶數量,也算得是“超級能干”。

今天,大模型應用覆蓋文本生成、數據處理、PPT制作、市場營銷、客服售后、醫療診斷等各類通用的和垂直的場景。實際上,市場并不缺場景,而是缺乏能干、有效的應用,“卷”應用須在場景中找用戶、找價值。

*本文圖片均來源于網絡

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

?AI產業新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬個為什么》

?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/42879.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/42879.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/42879.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ubuntu 如何復制文件夾的內容

在Ubuntu中,您可以使用cp命令來復制文件夾的內容。如果您想要復制文件夾及其所有內容(包括子文件夾),可以使用-r(遞歸)選項。 cp -r /path/to/source/folder/* /path/to/destination/folder/ 這個命令會將s…

現在2024年網絡安全真實情況還好就業嗎?_2024年網絡安全專業到底行不行了

2024年網絡安全行業的前景看起來非常樂觀。根據當前的趨勢和發展,一些趨勢和發展可能對2024年網絡安全行業產生影響: 5G技術的廣泛應用:5G技術的普及將會使互聯網的速度更快,同時也將帶來更多的網絡威脅和安全挑戰。網絡安全專家…

java-spring boot光速入門教程(超詳細!!)

目錄 一、引言 1.1 初始化配置 1.2 整合第三方框架 1.3 后期維護 1.4 部署工程 1.5 敏捷式開發 二、SpringBoot介紹 spring boot 2.1 搭建一個spring boot工程 2.2 使用idea創建項目 2.3 在線創建姿勢 2.4 項目的目錄結構 2.5 項目的運行方式 2.6 yml文件格式 2…

CP AUTOSAR標準之XCP(AUTOSAR_CP_SWS_XCP)(更新中……)

1 簡介和功能概述 該規范規定了AUTOSAR基礎軟件模塊XCP的功能、API和配置。XCP是主設備(工具)和從設備(設備)之間的協議描述(ASAM標準),提供以下基本功能: 同步數據采集(測量)同步數據刺激(用于快速原型設計)在線內存校準(讀/寫訪問)校準數據頁面初始化和切換用于ECU開發目的…

分享外貿工作中常用英文標準表達和英文語句

常用英文表達 報拉格斯最低到岸價 quote the lowest price CIF Lagos經營紡織品多年 be in the line of textiles for many years貨物受歡迎 the goods are very popular with customers / have met with a warm reception /be well received/accepted/ enjoy a wide populari…

Java線程死鎖及解決方法

多線程環境下,死鎖即兩個或兩個以上的線程去爭奪同一個共享資源,而導致互相等待的情況。 要產生死鎖,必須滿足如下四個條件: 互斥條件,共享資源x和y只能被一個線程占有請求和保持條件,T1持有x&#xff0c…

解讀BASE理論:高可用性與性能的完美平衡

Base概念 BASE 理論是一種處理大規模分布式系統中的數據一致性問題的思路。相比于傳統的嚴格一致性,它更靈活,適用于那些需要高可用性和性能的系統。BASE 理論由三個部分組成: 基本可用(Basically Available) 基本可用…

【c++刷題筆記-動態規劃】day32: 509. 斐波那契數 、 70. 爬樓梯 、 746. 使用最小花費爬樓梯

509. 斐波那契數 - 力扣&#xff08;LeetCode&#xff09; class Solution { public:int fib(int n) {if(n0){return 0;}vector<int>dp(n1);dp[0]0;dp[1]1;for(int i2;i<n;i){dp[i]dp[i-1]dp[i-2];}return dp[n];} }; 70. 爬樓梯 - 力扣&#xff08;LeetCode&#x…

pytorch 模型保存到本地之后,如何繼續訓練

在 PyTorch 中&#xff0c;你可以通過以下步驟保存和加載模型&#xff0c;然后繼續訓練&#xff1a; 保存模型 通常有兩種方式來保存模型&#xff1a; 保存整個模型&#xff08;包括網絡結構、權重等&#xff09;&#xff1a; torch.save(model, model.pth) 只保存模型的state…

利用亞馬遜云科技云原生Serverless代碼托管服務開發OpenAI ChatGPT-4o應用

今天小李哥繼續介紹國際上主流云計算平臺亞馬遜云科技AWS上的熱門生成式AI應用開發架構。上次小李哥分享?了利用谷歌云serverless代碼托管服務Cloud Functions構建Gemini Pro API?&#xff0c;這次我將介紹如何利用亞馬遜的云原生服務Lambda調用OpenAI的最新模型ChatGPT 4o。…

CSAL: the Next-Gen Local Disks for the Cloud——論文泛讀

EuroSys 2024 Paper 論文閱讀筆記整理 問題 云本地磁盤以其實惠的價格和高性能而極具吸引力。在云本地磁盤中&#xff0c;物理存儲設備直接連接到計算服務器&#xff0c;并作為塊設備虛擬化到虛擬機&#xff08;VM&#xff09;。在這種設置下&#xff0c;計算節點受其有限的計…

純前端如何實現Gif暫停、倍速播放

前言 GIF 我相信大家都不會陌生&#xff0c;由于它被廣泛的支持&#xff0c;所以我們一般用它來做一些簡單的動畫效果。一般就是設計師弄好了之后&#xff0c;把文件發給我們。然后我們就直接這樣使用&#xff1a; <img src"xxx.gif"/>這樣就能播放一個 GIF …

MPC學習資料匯總

模型預測控制MPC學習資料匯總 需要的私信我~ 需要的私信我~ 需要的私信我~ 【01】課件內容 包含本號所有MPC課程的課件&#xff0c;以及相關MATLAB文檔。 【02】課件源代碼 本號所有MPC課程的源代碼。 【03】MPC仿真案例 三個MPC大型仿真案例&#xff1a; 1&#xff09;…

Python面試題:在 Python 中如何進行多線程編程?

在 Python 中進行多線程編程通常使用 threading 模塊。下面是一個簡單的示例&#xff0c;展示了如何創建和啟動多個線程。 示例代碼 import threading import time# 定義一個簡單的函數&#xff0c;它將在線程中運行 def print_numbers():for i in range(10):print(f"Nu…

鏈接器的工作原理,靜態鏈接與動態鏈接的區別,如何創建和使用動態鏈接庫

鏈接器在程序開發中的作用至關重要&#xff0c;它負責將多個目標文件和庫文件整合成一個可以執行的文件。在深入了解鏈接器的工作原理、靜態鏈接與動態鏈接的區別&#xff0c;以及如何創建和使用動態鏈接庫之前&#xff0c;我們先來概述一下鏈接器的基本功能。 鏈接器的工作原…

20240704每日后端------聊聊 mybatis的 where 1=1

目標 最近&#xff0c;在項目中使用MyBatis進行SQL腳本編寫時&#xff0c;我遇到了以“WHERE 11”開頭的WHERE子句的做法&#xff0c;以簡化多個條件的串聯。這里有一個例子來討論這種技術以及“WHERE 11”是否對性能有任何影響。 <select id"" parameterType&q…

【數據結構】09.樹與二叉樹

一、樹的概念與結構 1.1 樹的概念 樹是一種非線性的數據結構&#xff0c;它是由n&#xff08;n>0&#xff09;個有限結點組成一個具有層次關系的集合。把它叫做樹是因為它看起來像一棵倒掛的樹&#xff0c;也就是說它是根朝上&#xff0c;而葉朝下的。 根結點&#xff1a;根…

04采訪:數字人直播

?AI技術的迭代對數字人直播一定是有正向推動作用的。直播可持續性差,投入產出極不協調。不適合前期大量投入。直播現在這個東西有一個問題,因為直播開始帶貨了,就已經不是一個單純的娛樂性質的視頻內容,而是對帶有一種商業目的內容。 直播帶貨的痛點:對主播而言是觀眾;…

俯臥撐計數器(Python)

通過 MediaPipe 檢測人體姿態&#xff0c;計算俯臥撐角度和計數&#xff0c;并在圖像上進行可視化展示 需要有cv2庫和mediapipe庫 mediapipe庫&#xff1a; MediaPipe是Google開源的機器學習框架&#xff0c;用于構建實時音頻、視頻和多媒體處理應用程序。它提供了一組預訓練的…

一文清晰了解HTML

有這樣一個txt記事本文件和一張圖片&#xff1a; txt文本內容是這樣的&#xff1a; <html><head><title>HTML學習</title></head><body><h1>hello HTML</h1><img src"高清修復.png"/></body> </html…