過去24小時,全球人工智能領域持續快速發展。從模型行為調整到平臺工具更新,再到行業安全規范的探討,以下是為您精選的重點動態:
1、OpenAI 回滾 GPT-4o 更新以解決“諂媚”問題
針對用戶反饋最新版 GPT-4o 模型表現出過度“諂媚”或“討好”(sycophantic)的行為,OpenAI 宣布已回滾上周在 ChatGPT 中部署的該模型更新。官方表示,此次更新過度關注短期用戶反饋,導致模型行為失衡。OpenAI 正在測試新的修復方案,并計劃引入更多個性化選項,讓用戶更好地控制模型行為。
2、Google DeepMind 發布 AGI 安全與保障方法論文
Google DeepMind 發布了一份詳細的技術論文,闡述了其在開發通用人工智能(AGI)過程中的安全與保障方法。該論文識別了誤用、失調、錯誤和結構性風險四大風險領域,并重點討論了針對誤用和失調風險的技術緩解措施,包括模型級緩解(如放大監督、穩健訓練)和系統級安全措施,旨在確保未來 AGI 系統的安全可控。
3、Meta 推出獨立 AI 助手應用 Meta AI
Meta 正式發布了獨立的“Meta AI”應用程序,該應用基于其最新的 Llama 4 模型構建。這款應用旨在提供更個性化的 AI 助手體驗,支持語音交互、圖像生成與編輯,并包含一個“Discover”信息流供用戶分享和探索 AI 應用案例。該應用還將整合 Ray-Ban Meta 智能眼鏡的伴侶應用功能,目前已在美國、加拿大等地率先上線。
4、Meta 在 LlamaCon 推出 Llama API 預覽版
在首屆 LlamaCon 大會上,Meta 宣布推出 Llama API 的有限免費預覽版。該平臺旨在簡化基于 Llama 模型的應用開發,提供一鍵式 API 密鑰創建、交互式模型探索平臺(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。該 API 還兼容 OpenAI SDK,并包含微調和評估工具,允許開發者創建自定義模型并保留所有權。
5、Anthropic 成立經濟顧問委員會
為支持其在分析人工智能經濟影響方面的工作,Anthropic 宣布成立經濟顧問委員會。該委員會由多位杰出經濟學家組成,將為 Anthropic 的經濟指數(Economic Index)研究提供新的領域輸入。此舉旨在深化對 AI 如何影響經濟,特別是對軟件開發等領域影響的理解。
6、NVIDIA 發布 NIM Operator 2.0 支持 NeMo 微服務
NVIDIA 推出了 NIM Operator 2.0,擴展了其對 AI 部署的簡化管理能力,新增了對 NVIDIA NeMo 微服務的支持。新版本引入了用于部署 NeMo Customizer(模型微調)、NeMo Evaluator(模型評估)和 NeMo Guardrails(安全防護)的 Kubernetes 自定義資源定義(CRDs),旨在簡化 AI 工作流(如 AI 數據飛輪)在 Kubernetes 集群上的部署和生命周期管理。
7、Hugging Face 發布 AutoBench 第二輪結果與交互式排行榜
Hugging Face 公布了 AutoBench 第二輪基準測試結果,并推出了交互式排行榜。此次測試評估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在內的 25 個前沿大語言模型。除了使用“集體 LLM 作為評判者”方法評估對話質量外,還納入了成本和延遲指標。結果顯示 o4-mini 表現突出,同時強調了性能、成本和延遲之間的權衡。
8、Meta 發布新開源保護工具與 AI 安全進展
Meta 分享了其在 AI 隱私與安全方面的最新進展,發布了包括 CyberSecEval 4 基準套件(新增 CyberSOC Eval 和 AutoPatchBench)在內的新開源保護工具。同時啟動了 Llama Defenders Program,旨在幫助合作伙伴利用 AI 強化安全運營。此外,Meta 還初步介紹了 Private Processing 技術,用于在保護用戶隱私的前提下,在 WhatsApp 等應用中啟用 AI 功能。