AI News
1、字節跳動發布Seaweed-7B視頻模型:70億參數實現音視頻同步生成與多鏡頭敘事
字節跳動推出新一代視頻生成模型Seaweed-7B,該模型僅70億參數卻實現多項突破:支持音視頻同步生成、多鏡頭敘事(保持角色連貫性)、2K分辨率實時生成(24fps)及3D場景模擬。采用DiT架構和對抗后訓練技術,推理速度較同類快62倍,訓練成本僅為行業1/3。目前已通過即夢平臺提供試用,其低成本高效率特性將重塑短視頻創作、虛擬主播等領域的生產模式,成為繼Sora后AI視頻生成的重要里程碑。
2、智譜AI啟動IPO輔導:沖刺A股首家上市大模型企業,估值超300億元
國內AI領軍企業智譜AI正式啟動IPO輔導,有望成為A股首家上市的大模型公司。該公司依托清華大學技術背景,已推出GLM系列大模型及ChatGLM等商業化產品,最新開源模型GLM-4-32B-0414以低成本高效率引發行業關注。目前智譜AI在C端和B端市場均取得突破,完成超100億元融資后估值達300億元,其重點布局的AI Agent領域與三星等企業展開合作,若成功上市將開創國內大模型企業資本化先河。
3、OpenAI發布GPT-4.1提示工程指南:精準指令驅動模型性能躍升
OpenAI針對GPT-4.1模型發布全新提示工程指南,強調該版本具有更嚴格的指令遵循特性,需通過清晰具體的提示(推薦XML/GDM結構化格式)才能發揮最佳性能。指南提出分步規劃、工具調用優化等策略,在代碼生成等任務中顯著提升效果,建議開發者摒棄模糊表述而采用顯式指令。這一調整標志著從GPT-4的"意圖推測"轉向"精準執行"的設計哲學轉變,為構建高可靠性AI應用提供方法論支撐,目前已在開發者社區引發廣泛實踐。
4、Firefox引入AI鏈接預覽功能:懸停即可智能生成網頁摘要
Mozilla為Firefox瀏覽器新增AI驅動的鏈接預覽功能,用戶懸停鼠標即可自動獲取目標網頁的智能摘要,無需點擊即可快速判斷內容相關性。該功能在提升瀏覽效率的同時,通過僅展示摘要而非全文的方式兼顧網站流量保護。雖然谷歌Chrome目前也提供鏈接預覽但尚未整合AI技術,行業預計類似AI功能將成為瀏覽器標配,推動網頁瀏覽體驗的智能化升級。
5、騰訊云大模型知識引擎支持MCP協議:開放插件生態賦能AI應用開發
騰訊云宣布其大模型知識引擎升級支持MCP協議,開發者可直接調用平臺精選的EdgeOne、Figma等MCP插件或集成自定義插件,覆蓋網頁部署、位置服務等多元場景。該升級通過標準化協議降低開發門檻,提供靈活可擴展的插件生態,加速企業級AI應用的快速落地與功能拓展。
6、阿里通義實驗室發布OmniTalker:雙分支DiT架構實現數字人音視頻完美同步
阿里通義實驗室推出數字人生成模型OmniTalker,通過雙分支DiT架構實現文本驅動的高保真音視頻合成,用戶僅需上傳參考視頻即可精準復現人物表情、聲音和說話風格。該模型突破傳統級聯流水線的音畫不同步問題,在魔搭社區和HuggingFace提供免費體驗,其多模態特征融合技術使生成效果接近實拍水平,顯著降低數字人制作成本,為虛擬主播、智能助手等場景提供新解決方案。
7、國產開源模型HiDream-I1發布:17B參數媲美GPT-4o,登頂國際AI榜單
智象未來發布國內首款開源圖像生成模型HiDream-I1,該17億參數模型在真實感、細節還原和指令理解方面表現優異,成功登頂Artificial Analysis測試平臺榜首,成為首個獲此成績的中國自研生成式AI模型。用戶可通過自然語言提示生成高質量圖像,其水花、動態等細節處理能力媲美GPT-4o,目前已在HuggingFace和GitHub開源,即將推出的HiDream-E1版本還將支持交互式編輯功能,推動國產開源AI技術發展。
8、Haisnap上線:AI驅動零代碼開發,自然語言秒變可運行網頁應用
AI應用開發平臺Haisnap正式推出,通過多智能體協作實現自然語言描述到完整網頁應用的自動生成,用戶僅需輸入需求(如"性格測試應用")即可獲得可訪問鏈接及下載源代碼。該平臺采用需求理解、代碼生成、界面設計、測試優化四類AI協同工作,支持前端后端代碼打包下載,顯著降低開發門檻,適用于教育、營銷等場景的快速原型開發,推動無代碼AI工具向更廣泛用戶群體普及。
9、MiniMax發布MCP Server:文本指令一鍵調用視頻/語音/圖像生成能力
MiniMax正式推出多模態AI服務器MCP Server,通過標準化協議整合視頻生成、圖像創作、語音合成及聲音克隆等能力,開發者僅需文本指令即可調用。該服務兼容Claude、Cursor等主流MCP客戶端,其聲音克隆功能因高保真度獲用戶好評,結合低成本API策略,有望推動短視頻、虛擬交互等場景的創新應用。此次發布標志著國產AI在多模態領域的技術突破,為開發者提供對標OpenAI Sora的本地化解決方案。
10、月之暗面Kimi推出內容社區:大模型產品轉向用戶互動新賽道
月之暗面啟動旗下AI助手Kimi的內容社區灰度測試,該產品從單次對話工具升級為UGC互動平臺,支持用戶分享與消費生成內容。這家清華系創業公司曾以200萬字長文本處理能力引發關注,近期在調整模型服務價格(最高降幅83%)后,試圖通過社區化運營提升用戶留存,探索廣告與訂閱等商業化路徑,但需應對內容合規和用戶活躍度等挑戰。
11、智譜AI開源32B/9B系列GLM模型并啟用Z.ai平臺:推理速度200tokens/秒,成本僅競品1/30
智譜AI宣布開源32B和9B參數的GLM系列模型,包括基座、推理及沉思三類,采用MIT許可允許商用。其中GLM-Z1-32B-0414推理速度達200tokens/秒,成本為競品DeepSeek-R1的1/30,在數學代碼等任務表現媲美更大模型;同步推出的Z.ai平臺整合三類模型提供免費體驗,其沉思模型通過搜索工具整合實現研究閉環能力,MaaS平臺同時上線免費和高性能API服務,顯著降低企業AI應用門檻。
12、快手可靈AI發布2.0視頻/圖像生成模型:全球用戶破2200萬,商業化收入超1億
快手旗下可靈AI正式推出可靈2.0視頻生成與可圖2.0圖像生成模型,其1.6pro版本此前已在Artificial Analysis圖生視頻榜單超越Google Veo 2登頂全球第一。數據顯示,該平臺累計生成超1.68億視頻及3.44億圖片,全球用戶達2200萬,商業化收入突破1億元,最新迭代版本在動態質量和語義理解上保持領先,通過App、Web等多端產品矩陣持續擴大AI創作生態影響力。