【AI News | 20250415】每日AI進展

AI News

1、字節跳動發布Seaweed-7B視頻模型:70億參數實現音視頻同步生成與多鏡頭敘事
字節跳動推出新一代視頻生成模型Seaweed-7B,該模型僅70億參數卻實現多項突破:支持音視頻同步生成、多鏡頭敘事(保持角色連貫性)、2K分辨率實時生成(24fps)及3D場景模擬。采用DiT架構和對抗后訓練技術,推理速度較同類快62倍,訓練成本僅為行業1/3。目前已通過即夢平臺提供試用,其低成本高效率特性將重塑短視頻創作、虛擬主播等領域的生產模式,成為繼Sora后AI視頻生成的重要里程碑。

2、智譜AI啟動IPO輔導:沖刺A股首家上市大模型企業,估值超300億元
國內AI領軍企業智譜AI正式啟動IPO輔導,有望成為A股首家上市的大模型公司。該公司依托清華大學技術背景,已推出GLM系列大模型及ChatGLM等商業化產品,最新開源模型GLM-4-32B-0414以低成本高效率引發行業關注。目前智譜AI在C端和B端市場均取得突破,完成超100億元融資后估值達300億元,其重點布局的AI Agent領域與三星等企業展開合作,若成功上市將開創國內大模型企業資本化先河。

3、OpenAI發布GPT-4.1提示工程指南:精準指令驅動模型性能躍升
OpenAI針對GPT-4.1模型發布全新提示工程指南,強調該版本具有更嚴格的指令遵循特性,需通過清晰具體的提示(推薦XML/GDM結構化格式)才能發揮最佳性能。指南提出分步規劃、工具調用優化等策略,在代碼生成等任務中顯著提升效果,建議開發者摒棄模糊表述而采用顯式指令。這一調整標志著從GPT-4的"意圖推測"轉向"精準執行"的設計哲學轉變,為構建高可靠性AI應用提供方法論支撐,目前已在開發者社區引發廣泛實踐。

4、Firefox引入AI鏈接預覽功能:懸停即可智能生成網頁摘要
Mozilla為Firefox瀏覽器新增AI驅動的鏈接預覽功能,用戶懸停鼠標即可自動獲取目標網頁的智能摘要,無需點擊即可快速判斷內容相關性。該功能在提升瀏覽效率的同時,通過僅展示摘要而非全文的方式兼顧網站流量保護。雖然谷歌Chrome目前也提供鏈接預覽但尚未整合AI技術,行業預計類似AI功能將成為瀏覽器標配,推動網頁瀏覽體驗的智能化升級。

5、騰訊云大模型知識引擎支持MCP協議:開放插件生態賦能AI應用開發
騰訊云宣布其大模型知識引擎升級支持MCP協議,開發者可直接調用平臺精選的EdgeOne、Figma等MCP插件或集成自定義插件,覆蓋網頁部署、位置服務等多元場景。該升級通過標準化協議降低開發門檻,提供靈活可擴展的插件生態,加速企業級AI應用的快速落地與功能拓展。

6、阿里通義實驗室發布OmniTalker:雙分支DiT架構實現數字人音視頻完美同步
阿里通義實驗室推出數字人生成模型OmniTalker,通過雙分支DiT架構實現文本驅動的高保真音視頻合成,用戶僅需上傳參考視頻即可精準復現人物表情、聲音和說話風格。該模型突破傳統級聯流水線的音畫不同步問題,在魔搭社區和HuggingFace提供免費體驗,其多模態特征融合技術使生成效果接近實拍水平,顯著降低數字人制作成本,為虛擬主播、智能助手等場景提供新解決方案。

7、國產開源模型HiDream-I1發布:17B參數媲美GPT-4o,登頂國際AI榜單
智象未來發布國內首款開源圖像生成模型HiDream-I1,該17億參數模型在真實感、細節還原和指令理解方面表現優異,成功登頂Artificial Analysis測試平臺榜首,成為首個獲此成績的中國自研生成式AI模型。用戶可通過自然語言提示生成高質量圖像,其水花、動態等細節處理能力媲美GPT-4o,目前已在HuggingFace和GitHub開源,即將推出的HiDream-E1版本還將支持交互式編輯功能,推動國產開源AI技術發展。

8、Haisnap上線:AI驅動零代碼開發,自然語言秒變可運行網頁應用
AI應用開發平臺Haisnap正式推出,通過多智能體協作實現自然語言描述到完整網頁應用的自動生成,用戶僅需輸入需求(如"性格測試應用")即可獲得可訪問鏈接及下載源代碼。該平臺采用需求理解、代碼生成、界面設計、測試優化四類AI協同工作,支持前端后端代碼打包下載,顯著降低開發門檻,適用于教育、營銷等場景的快速原型開發,推動無代碼AI工具向更廣泛用戶群體普及。

9、MiniMax發布MCP Server:文本指令一鍵調用視頻/語音/圖像生成能力
MiniMax正式推出多模態AI服務器MCP Server,通過標準化協議整合視頻生成、圖像創作、語音合成及聲音克隆等能力,開發者僅需文本指令即可調用。該服務兼容Claude、Cursor等主流MCP客戶端,其聲音克隆功能因高保真度獲用戶好評,結合低成本API策略,有望推動短視頻、虛擬交互等場景的創新應用。此次發布標志著國產AI在多模態領域的技術突破,為開發者提供對標OpenAI Sora的本地化解決方案。

10、月之暗面Kimi推出內容社區:大模型產品轉向用戶互動新賽道
月之暗面啟動旗下AI助手Kimi的內容社區灰度測試,該產品從單次對話工具升級為UGC互動平臺,支持用戶分享與消費生成內容。這家清華系創業公司曾以200萬字長文本處理能力引發關注,近期在調整模型服務價格(最高降幅83%)后,試圖通過社區化運營提升用戶留存,探索廣告與訂閱等商業化路徑,但需應對內容合規和用戶活躍度等挑戰。

11、智譜AI開源32B/9B系列GLM模型并啟用Z.ai平臺:推理速度200tokens/秒,成本僅競品1/30
智譜AI宣布開源32B和9B參數的GLM系列模型,包括基座、推理及沉思三類,采用MIT許可允許商用。其中GLM-Z1-32B-0414推理速度達200tokens/秒,成本為競品DeepSeek-R1的1/30,在數學代碼等任務表現媲美更大模型;同步推出的Z.ai平臺整合三類模型提供免費體驗,其沉思模型通過搜索工具整合實現研究閉環能力,MaaS平臺同時上線免費和高性能API服務,顯著降低企業AI應用門檻。

12、快手可靈AI發布2.0視頻/圖像生成模型:全球用戶破2200萬,商業化收入超1億
快手旗下可靈AI正式推出可靈2.0視頻生成與可圖2.0圖像生成模型,其1.6pro版本此前已在Artificial Analysis圖生視頻榜單超越Google Veo 2登頂全球第一。數據顯示,該平臺累計生成超1.68億視頻及3.44億圖片,全球用戶達2200萬,商業化收入突破1億元,最新迭代版本在動態質量和語義理解上保持領先,通過App、Web等多端產品矩陣持續擴大AI創作生態影響力。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/901542.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/901542.shtml
英文地址,請注明出處:http://en.pswp.cn/news/901542.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何實現動態請求地址(baseURL)

需求: 在項目中遇到了需要實時更換請求地址,后續使用修改后的請求地址(IP) 例如:原ip請求為http://192.168.1.1:80/xxx,現在需要你點擊或其他操作將其修改為http://192.168.1.2:80/xxx,該如何操作 tips: 修改后需要跳轉( 修改了IP之前的不可使用,需要訪問修改后的地址來操作 …

Open AI 使用篇

一.function Calling 大模型中的 function calling 指的是在人工智能模型(如 GPT-4)中調用外部函數或API,以便模型能夠執行更復雜的任務或獲取外部數據。這種方式允許模型在生成回答時不僅僅依賴于內部的訓練數據,還能夠與外部系…

6.DJI-PSDK:psdk訂閱無人機高度/速度/GPS/RTK/時間/經緯度等消息及問題解決

DJI-PSDK:psdk訂閱無人機高度/速度/GPS/RTK/時間/經緯度等消息 消息訂閱可以獲取絕大多數無人機的動態信息,包括無人機的姿態、速度、加速度、角速度、高度、GPS 位置、云 臺的角度和狀態、飛行模式和飛行狀態、電機和電池等各類關鍵信息。 這些信息并不會“一股腦兒地”全部…

100 個網絡安全基礎知識

1. 什么是網絡安全? 網絡安全是指采取必要措施,防范對網絡的攻擊、侵入、干擾、破壞和非法使用以及意外事故,使網絡處于穩定可靠運行的狀態,保障網絡數據的完整性、保密性、可用性。(參考《中華人民共和國網絡安全法》…

第七屆IEEE通信、信息系統與計算機工程國際會議(CISCE 2025)

重要信息 官網:www.iccisce.com 時間:2025年5月9-11日 地點:中國-廣州 征稿主題 通信技術 信息系統 ?5G/6G通信系統與網絡 ?無線通信與移動網絡 ?光纖通信與光網絡 ?衛星與空間通信 ?通信信號處理與編碼 ?無線傳感器網絡 ?物聯網…

OpenCV 圖像拼接

一、圖像拼接的介紹 圖像拼接是一種將多幅具有部分重疊內容的圖像合并成一幅完整、無縫且具有更廣闊視野或更高分辨率圖像的技術。其目的是通過整合多個局部圖像來獲取更全面、更具信息價值的圖像內容。 二、圖像拼接的原理 圖像拼接的核心目標是將多幅有重疊區域的圖像進行準…

第十一章 網絡編程

在TCP/IP協議中,“IP地址TCP或UDP端口號”唯一標識網絡通訊中的一個進程。 因此可以用Socket來描述網絡連接的一對一關系。 常用的Socket類型有兩種:流式Socket(SOCK_STREAM)和數據報式Socket(SOCK_DGRAM&#xff09…

ffmpeg實現視頻流抽幀

ffmpeg 實現視頻流抽幀 抽取實時視頻幀 如果你的實時視頻是通過 RTSP、UDP 或其他協議獲取的,可以直接調用 FFmpeg 命令來抽取幀。 ffmpeg 命令 示例 1 ffmpeg -i rtsp://your_rtsp_stream_url -vf fps1 -update 1 output.jpg說明: -i rtsp://your…

【GIT】放棄”本地更改,恢復到遠程倉庫的狀態git fetch origin git reset --hard origin/分支名

如果你想完全放棄本地更改,恢復到遠程倉庫的狀態,可以按照以下步驟操作: 獲取遠程最新版本 首先執行: git fetch origin這條命令會把遠程倉庫的最新提交拉取到你的本地,但不會自動合并到你的當前分支。 硬重置你的當前…

flutter doctor 信號號超時

報錯如下: :\Users\Administrator>flutter doctor Doctor summary (to see all details, run flutter doctor -v): [√] Flutter (Channel stable, 3.27.4, on Microsoft Windows [版本 10.0.22631.5189], locale zh-CN) [√] Windows Version (Installed versi…

【Linux】系統入門

【Linux】系統初識 起源開源 閉源版本內核內核編號 Linux的安裝雙系統(不推薦)WindowsLinuxvmware虛擬機vitualbox操作系統的鏡像centos 7/ubuntu云服務器租用 Linux的操作lsmkdir 文件名pwdadduser userdel -rrm文件名cat /proc/cpuinfolinux支持編程vim code.c./a.out 運行程…

mybatis-plus整合springboot與使用方式

注解 TableField(exist false)&#xff1a;表示該屬性不為數據庫表字段&#xff0c;但又是必須使用的。 整合springboot pom <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xs…

[第十六屆藍橋杯 JavaB 組] 真題 + 經驗分享

A&#xff1a;逃離高塔(AC) 這題就是簡單的簽到題&#xff0c;按照題意枚舉即可。需要注意的是不要忘記用long&#xff0c;用int的話會爆。 &#x1f4d6; 代碼示例&#xff1a; import java.io.*; import java.util.*; public class Main {public static PrintWriter pr ne…

GPU服務器聲音很響可以怎么處理

當GPU服務器運行時噪音過大&#xff0c;通常是由于高負載下散熱風扇高速運轉所致。以下是分步驟的解決方案&#xff0c;幫助您有效降低噪音并保持設備穩定運行&#xff1a; 一、排查噪音來源 定位聲源 ? 使用 聲級計 或手機分貝檢測APP&#xff0c;確定最大噪音位置&#xff0…

STM32平衡車開發實戰教程:從零基礎到項目精通

STM32平衡車開發實戰教程&#xff1a;從零基礎到項目精通 一、項目概述與基本原理 1.1 平衡車工作原理 平衡車是一種基于倒立擺原理的兩輪自平衡小車&#xff0c;其核心控制原理類似于人類保持平衡的過程。當人站立不穩時&#xff0c;會通過腿部肌肉的快速調整來維持平衡。平…

C#設計模式-狀態模式

狀態模式案例解析&#xff1a;三態循環燈的實現 案例概述 本案例使用 狀態模式&#xff08;State Pattern&#xff09; 實現了一個 三態循環燈 的功能。每點擊一次按鈕&#xff0c;燈的狀態會按順序切換&#xff08;狀態1 → 狀態2 → 狀態3 → 狀態1...&#xff09;&#xff…

Mac系統升級node.js版本和npm版本并安裝pnpm

1.升級node.js版本 第一步&#xff1a;查詢當前node.js版本 node -v第二步&#xff1a;清除node.js的緩存 sudo npm cache clean -f第三步&#xff1a;驗證緩存是否清空 npm cache verify第四步&#xff1a;安裝n工具&#xff0c;n工具是專門用于管理node.js版本的工具 su…

[net 5] udp_dict_server 基于udp的簡單字典翻譯(服務器與業務相分離)

目錄 1. 功能了解 1.1. 啥是 dic_server? 1.2. dic_server 的小目標 2. 基本框架 2.1. 基本文件框架 2.2. 業務與服務器解耦 -> 回調函數 3. 字典 3.1. 字典配置文件 3.2. 構建字典類 3.2.1. 字典類的基本成員 3.2.2. 字典類構造 3.2.2.1. 構造 3.2.2.2. 信息加…

七種驅動器綜合對比——《器件手冊--驅動器》

九、驅動器 名稱 功能與作用 工作原理 優勢 應用 隔離式柵極驅動器 隔離式柵極驅動器用于控制功率晶體管&#xff08;如MOSFET、IGBT、SiC或GaN等&#xff09;的開關&#xff0c;其核心功能是將控制信號從低壓側傳輸到高壓側的功率器件柵極&#xff0c;同時在輸入和輸出之…

EM儲能網關ZWS智慧儲能云應用(8) — 電站差異化支持

面對不同項目、種類繁多的儲能產品&#xff0c;如何在儲能云平臺上進行電站差異化支持尤為關鍵&#xff0c;ZWS智慧儲能云從多方面支持儲能電站差異化。 簡介 隨著行業發展&#xff0c;市場“內卷”之下&#xff0c;各大儲能企業推陳出新的速度加快。面對不同項目、種類繁多…