????????美國斯坦福大學 “以人為本人工智能研究院”(HAI)近日發布的第八版《人工智能指數報告》(AI Index Report 2025)備受全球矚目。自 2017 年首次發布以來,該報告一直為政策制定者、研究人員、企業高管和公眾提供準確、嚴謹且全球化的 AI 數據與洞察。正如報告聯合主席 Yolanda Gil 和 Raymond Perrault 在序言中提到,2024 年是人工智能發展史上具有里程碑意義的一年,AI 正以前所未有的速度融入社會、經濟和全球治理的各個方面。?
一、報告核心內容概述?
今年這份長達四百多頁的報告,是迄今為止最為全面的一版。它新增了對 AI 硬件演進、推理成本估算、AI 出版和專利趨勢的深入分析,并擴大了關于企業采用負責任 AI 實踐以及 AI 在科學和醫學領域角色的新鮮數據。報告共八個章節,其核心內容主要體現在以下幾個關鍵方面。?
二、技術前沿:性能突破與競爭格局演變?
(一)基準性能飛躍?
2023 年研究人員引入了 MMMU、GPQA、SWE-bench 等一系列旨在難倒頂尖 AI 的新基準。然而,僅僅一年之后,AI 模型在這些基準上的表現就取得了驚人的進步。例如,在這些基準上的得分分別提升了 18.8、48.9 和 67.3 個百分點。特別是在 SWE-bench(軟件工程基準)上,AI 解決編碼問題的能力從 2023 年的僅 4.4% 飆升至 2024 年的 71.7%。同時,高質量視頻生成等領域也取得了重大進展,這表明 AI 在復雜任務處理和特定領域應用上的能力得到了極大提升。?
(二)中美競爭格局變化?
美國在頂尖 AI 模型的發布數量上仍占據優勢,2024 年發布了 40 個值得關注的模型,遠超中國的 15 個和歐洲的 3 個。不過,數量優勢并不等同于性能優勢。在 MMLU、HumanEval 等關鍵基準測試中,中美頂尖模型之間的性能差距從 2023 年的兩位數迅速縮小至 2024 年的近乎持平,部分基準差距僅為個位數甚至零點幾。這清晰地顯示出中國 AI 模型在質量上正快速追趕,全球 AI 技術競爭格局愈發激烈。?
(三)技術前沿收斂?
競爭的加劇使得技術前沿呈現出 “擁擠” 態勢。LMSYS Chatbot Arena 的數據顯示,排名第一和第十的模型之間的 Elo 分數差距從一年前的 11.9% 縮小到了 5.4%,排名前兩位的模型差距更是從 4.9% 驟降至僅 0.7%。這意味著頂尖模型的性能水平日益接近,高質量模型不再被少數巨頭壟斷,開發者生態系統的競爭力不斷增強。?
(四)小型與開源模型崛起?
“小模型” 在 2024 年展現出強大能力。2022 年,在 MMLU 上得分超過 60% 的最小模型是擁有 5400 億參數的 PaLM,而到 2024 年,微軟僅有 38 億參數的 Phi-3-mini 就達到了同樣門檻,參數量縮減了 142 倍,這得益于算法效率的提升。同時,開源 / 開放權重模型與閉源模型之間的性能差距幾乎消失。在 Chatbot Arena 上,2024 年初領先的閉源模型比頂尖開放權重模型高出 8.04%,到 2025 年初,這一差距已縮小至 1.70%。這表明先進 AI 技術的獲取門檻正在快速降低,有利于 AI 技術的更廣泛傳播與應用。?
(五)成本效益提升?
報告首次追蹤推理成本發現,達到 GPT-3.5(在 MMLU 上約 64.8% 準確率)性能水平的 AI 模型,其推理成本從 2022 年 11 月的每百萬 token 20 美元,驟降至 2024 年 10 月的僅 0.07 美元(以 Gemini-1.5-Flash-8B 為例),降幅超過 280 倍。在硬件層面,成本每年下降約 30%,而能效每年提升約 40%。成本的降低和能效的提升使得 AI 應用更加經濟可行,為 AI 在更多領域的大規模應用奠定了基礎。?
(六)AI Agent 嶄露頭角?
2024 年推出的 RE-Bench 為評估 AI 智能體的復雜任務提供了嚴格基準測試。在短時間范圍(兩小時)內,頂級 AI 系統的得分是人類專家的四倍,但當給予更多時間完成任務時,人類表現優于 AI,在 32 小時時間框架內領先 AI 兩倍。盡管如此,AI 智能體在特定任務上,如編寫特定類型的代碼,已經能夠與人類專業知識相匹配,并且能夠提供更快的結果,這顯示出 AI 智能體在特定場景下的應用潛力。?
三、產業與經濟:投資增長與企業應用普及?
(一)投資創新高?
全球私有 AI 投資在經歷短暫回調后,于 2024 年強勁反彈至創紀錄的 2523 億美元(企業總投資,包括并購等)。其中,私有投資額達到 1,508 億美元,同比增長 44.5%。在生成式 AI 領域,美國投資額(2024 年為 290.4 億美元)比中國和歐盟 + 英國的總和還要多出 254 億美元,差距進一步拉大。生成式 AI 本身成為吸金熱點,全球共獲得 339 億美元投資,同比增長 18.7%,這反映出資本對 AI 領域,尤其是生成式 AI 的強烈看好。?
(二)企業應用普及?
企業對 AI 的應用不再停留在實驗階段。麥肯錫的調查顯示,2024 年報告在其組織中至少一個業務功能中使用 AI 的受訪者比例從 2023 年的 55% 躍升至 78%,報告使用生成式 AI 的比例也從 33% 翻倍增長至 71%。這表明 AI 正從企業的邊緣工具轉變為核心驅動力,廣泛應用于企業的各個業務環節。?
(三)生產力效應與價值兌現?
越來越多的研究證實了 AI 對生產力的積極影響,尤其在縮小低技能和高技能工人之間的差距方面。不過,在報告 AI 帶來財務影響的企業中,大部分表示效益仍處于較低水平。例如,49% 在服務運營中使用 AI 的企業報告了成本節約,但多數節約幅度低于 10%;71% 在市場營銷中使用 AI 的企業報告了收入增長,但最常見的增長幅度也低于 5%。這說明雖然 AI 對生產力有促進作用,但企業要充分實現 AI 帶來的價值還需要進一步探索和優化應用方式。?
(四)機器人領域格局?
在工業機器人領域,中國繼續保持主導地位,2023 年安裝量達 27.63 萬臺,是日本的 6 倍,美國的 7.3 倍,占全球份額的 51.1%。盡管相比 2022 年增速略有放緩,但其領先優勢依然巨大。同時,協作機器人和面向人類的服務機器人安裝量持續增長,顯示出機器人應用場景不斷擴展,AI 技術在機器人領域的應用正推動著行業的發展與變革。?
(五)能源格局變化?
AI 龐大的算力需求正在推動能源來源的重大變化,吸引了對核能的關注。隨著 AI 技術的不斷發展,其對能源的需求持續增長,傳統能源可能難以滿足,促使人們探索新的能源解決方案,核能等高效能源因此進入視野,這將對未來能源格局產生深遠影響。?
四、社會與政策:負面事件增加與監管加強?
(一)負面事件攀升?
根據 AI 事件數據庫的記錄,2024 年報告的 AI 相關負面事件達到 233 起,創下歷史新高,比 2023 年增長了 56.4%。這既反映了 AI 應用范圍的擴大,也凸顯了 AI 發展過程中潛在風險的增加,如數據泄露、算法偏見、虛假信息傳播等問題,給社會帶來了諸多挑戰。?
(二)監管趨勢?
面對 AI 帶來的各種風險和挑戰,全球范圍內政府監管日益收緊。越來越多的國家和地區開始制定相關政策和法規,以規范 AI 的開發和應用,確保 AI 的安全、可靠和公平。例如,歐盟的《通用數據保護條例》(GDPR)對數據隱私保護做出了嚴格規定,美國也在多個州推進 AI 相關立法工作,這顯示出監管在 AI 發展中的重要性日益凸顯。?
五、總結與展望?
《人工智能指數報告 2025》全面展現了 AI 在技術、產業、經濟、社會等多方面的發展態勢。在技術上,AI 性能不斷突破,競爭格局發生深刻變化,小型和開源模型崛起,成本效益顯著提升;在產業與經濟領域,投資熱情高漲,企業應用普及,機器人領域格局穩定且應用場景拓展,能源格局也因 AI 而改變;在社會與政策方面,負面事件增加促使監管加強。未來,AI 的發展將繼續受到技術創新、市場需求、政策監管等多因素的驅動和影響。我們需要充分利用 AI 帶來的機遇,同時積極應對其帶來的挑戰,以實現 AI 的可持續發展,讓 AI 更好地服務于人類社會。