Veo 3 可以生成視頻,并附帶配樂

谷歌最新的視頻生成 AI 模型 Veo 3 可以創建與其生成的剪輯相配的音頻。

周二,在谷歌 I/O 2025 開發者大會上,谷歌發布了 Veo 3。該公司聲稱,這款產品可以生成音效、背景噪音,甚至對話,為其制作的視頻增添配樂。谷歌表示,Veo 3 在生成的視頻質量方面也比上一代Veo 2有所提升。

Veo 3 從周二開始在谷歌的 Gemini 聊天機器人應用程序中推出,供谷歌每月 249.99 美元的 AI Ultra 計劃訂閱者使用,可以通過文本或圖像進行提示。

谷歌人工智能研發部門 DeepMind 的首席執行官 Demis Hassabis 在新聞發布會上表示:“我們首次擺脫了視頻生成的無聲時代。你可以給 Veo 3 一個描述人物和環境的提示,并根據你希望的聲音效果提出對話建議。”

視頻生成器工具的廣泛普及,導致供應商數量激增,該領域已趨于飽和。包括?Runway、??Lightricks、Genmo、??Pika、??Higgsfield、Kling 和?Luma在內的初創公司,以及?OpenAI和阿里巴巴等科技巨頭,都在快速發布各種模型。在很多情況下,不同模型之間幾乎沒有什么區別。

如果谷歌能夠兌現其承諾,音頻輸出將成為 Veo 3 的一大差異化優勢。人工智能聲音生成工具并不?新鮮,用于創建視頻?音效?的模型也并非新鮮事物。但據谷歌稱,Veo 3 的獨特之處在于它能夠理解視頻中的原始像素,并自動將生成的聲音與視頻片段同步。

Veo 3 的誕生很可能得益于DeepMind 早期在“視頻轉音頻”人工智能領域的研究。去年 6 月,DeepMind 透露,他們正在開發一種人工智能技術,通過結合聲音、對話記錄和視頻片段來訓練模型,從而為視頻生成配樂。

DeepMind 不愿透露 Veo 3 訓練內容的具體來源,但 YouTube 的可能性很大。YouTube 是谷歌旗下的子公司,DeepMind?此前曾向?TechCrunch 透露,像 Veo 這樣的谷歌模型“可能”會使用一些 YouTube 內容進行訓練。

為了降低深度偽造的風險,DeepMind 表示正在使用其專有水印技術 SynthID 將隱形標記嵌入到 Veo 3 生成的幀中。?

盡管像谷歌這樣的公司將 Veo 3 宣傳為強大的創意工具,但許多藝術家對它們仍抱有警惕,這可以理解——它們可能會顛覆整個行業。代表好萊塢動畫師和漫畫家的工會——美國動畫協會 (Animation Guild) 委托進行的一項 2024 年?研究?估計,到 2026 年,美國將有超過 10 萬個電影、電視和動畫工作崗位被人工智能取代。

谷歌今天還推出了 Veo 2 的新功能,其中包括一項功能,允許用戶為模型提供人物、場景、物體和風格的圖像,以提高一致性。最新的 Veo 2 可以理解攝像機的旋轉、推拉和縮放等運動,并允許用戶在視頻中添加或刪除對象,或擴展視頻片段的幀率,例如將視頻從縱向轉換為橫向。

谷歌表示,所有這些新的 Veo 2 功能將在未來幾周內登陸其 Vertex AI API 平臺。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/80784.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/80784.shtml
英文地址,請注明出處:http://en.pswp.cn/web/80784.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Android本地語音識別引擎深度對比與集成指南:Vosk vs SherpaOnnx

技術選型對比矩陣 對比維度VoskSherpaOnnx核心架構基于Kaldi二次開發ONNX Runtime + K2新一代架構模型格式專用格式(需專用工具轉換)ONNX標準格式(跨框架通用)中文識別精度89.2% (TDNN模型)92.7% (Zipformer流式模型)內存占用60-150MB30-80MB遲表現320-500ms180-300ms多線程…

十四、Hive 視圖 Lateral View

作者:IvanCodes 日期:2025年5月20日 專欄:Hive教程 在Hive中,我們經常需要以不同于原始表結構的方式查看或處理數據。為了簡化復雜查詢、提供數據抽象,以及處理復雜數據類型(如數組或Map)&#…

微軟開源GraphRAG的使用教程-使用自定義數據測試GraphRAG

微軟在今年4月份的時候提出了GraphRAG的概念,然后在上周開源了GraphRAG,Github鏈接見https://github.com/microsoft/graphrag,截止當前,已有6900+Star。 安裝教程 官方推薦使用Python3.10-3.12版本,我使用Python3.10版本安裝時,在初始化項目過程中會報錯,切換到Python3.…

XXX企業云桌面系統建設技術方案書——基于超融合架構的安全高效云辦公平臺設計與實施

目錄 1. 項目背景與目標1.1 背景分析1.2 建設目標2. 需求分析2.1 功能需求用戶規模與場景終端兼容性2.2 非功能需求3. 系統架構設計3.1 總體架構圖流程圖說明3.2 技術選型對比3.3 網絡設計帶寬規劃公式4. 詳細實施方案4.1 分階段部署計劃4.2 桌面模板配置4.3 測試方案性能測試工…

數據直觀分析與可視化

數據直觀分析與可視化 一、數據的直觀分析核心價值 數據的直觀分析旨在通過視覺化的方式,幫助人們更直觀、更快速地理解數據的特征和模式,從而發現趨勢、異常值、分布情況以及變量之間的關系,為決策提供支持。 數據可視化與信息圖形、信息可…

Neo4j數據庫

Neo4j 是一款專門用來處理復雜關系的數據庫。我們可以簡單地將它理解為一個“用圖結構來管理數據的工具”。與我們常見的,像 Excel 那樣用表格(行和列)來存儲數據的傳統數據庫不同,Neo4j 采用了一種更接近人類思維對現實世界理解的…

Java異常處理全解析:從基礎到自定義

目錄 🚀前言🤔異常的定義與分類💯運行時異常💯編譯時異常💯異常的基本處理 🌟異常的作用🐧自定義異常💯自定義運行時異常💯自定義編譯時異常 ??異常的處理方案&#x1…

Redisson分布式集合原理及應用

Redisson是一個用于Redis的Java客戶端,它簡化了復雜的數據結構和分布式服務的使用。 適用場景對比 數據結構適用場景優點RList消息隊列、任務隊列、歷史記錄分布式共享、阻塞操作、分頁查詢RMap緩存、配置中心、鍵值關聯數據支持鍵值對、分布式事務、TTLRSet去重集…

打破次元壁,VR 氣象站開啟氣象學習新姿勢?

在教育領域,VR 氣象站同樣發揮著巨大的作用,為氣象教學帶來了全新的模式,打破了傳統教學的次元壁,讓學生們以全新的姿勢學習氣象知識。? 在傳統的氣象教學中,學生們主要通過課本、圖片和老師的講解來學習氣象知識。這…

k8s面試題-ingress

場景:我通過deployment更新pod,ingress是怎么把新的請求流量發送到我新的pod的?是怎么監控到我更新的pod的? 在 Kubernetes 中,Ingress 是一種 API 對象,用于管理外部訪問到集群內服務的 HTTP 和 HTTPS 路…

RHCE 練習三:架設一臺 NFS 服務器

一、題目要求 1、開放 /nfs/shared 目錄,供所有用戶查詢資料 2、開放 /nfs/upload 目錄,為 192.168.xxx.0/24 網段主機可以上傳目錄,并將所有用戶及所屬的組映射為 nfs-upload,其 UID 和 GID 均為 210 3.將 /home/tom 目錄僅共享給 192.16…

【動態導通電阻】GaN HEMT動態導通電阻的精確測量

2023 年 7 月,瑞士洛桑聯邦理工學院的 Hongkeng Zhu 和 Elison Matioli 在《IEEE Transactions on Power Electronics》期刊發表了題為《Accurate Measurement of Dynamic ON-Resistance in GaN Transistors at Steady-State》的文章,基于提出的穩態測量方法,研究了氮化鎵(…

AI 制作游戲美術素材流程分享(程序員方向粗糙版)

AI 制作游戲美術素材分享(程序員方向粗糙版) 視頻講解: 抖音:https://www.douyin.com/user/self?from_tab_namemain&modal_id7505691614690561295&showTabpost Bilibili: https://www.bilibili.com/video/BV1ojJGzZEve/ 寫在最前面: 本方法比較粗糙,只對對美術風…

Java求職面試:互聯網大廠技術棧深度解析

文章簡述 在這篇文章中,我們將通過一個模擬的面試場景,帶你深入了解Java求職面試中可能會遇到的技術棧問題。通過這個故事,你可以學習到相關技術點的具體應用場景和面試技巧。 正文 場景:某互聯網大廠的面試現場 面試官&#…

學習日記-day11-5.20

完成目標: comment.java package com.zcr.pojo; import org.hibernate.annotations.GenericGenerator;import javax.persistence.*; //JPA操作表中數據,可以將對應的實體類映射到一張表上Entity(name "t_comment")//表示當前的實體類與哪張表…

機器學習第十九講:交叉驗證 → 用五次模擬考試驗證真實水平

機器學習第十九講:交叉驗證 → 用五次模擬考試驗證真實水平 資料取自《零基礎學機器學習》。 查看總目錄:學習大綱 關于DeepSeek本地部署指南可以看下我之前寫的文章:DeepSeek R1本地與線上滿血版部署:超詳細手把手指南 交叉驗證…

Linux面試題集合(6)

創建多級目錄或者同級目錄 mkdir -p 文件名/文件名/文件名 mkdir -p 文件名 文件名 文件名 Linux創建一個文件 touch 文件名 DOS命令創建文件 echo 內容>文件名(創建一個有內容的文件) echo >文件名(創建一個沒有內容的文件&#xff09…

Vue百日學習計劃Day46-48天詳細計劃-Gemini版

Day 46: <KeepAlive> - 組件緩存與優化 (~3 小時) 本日目標: 理解 <KeepAlive> 的作用&#xff0c;學會如何使用它來緩存組件實例&#xff0c;從而優化應用性能和用戶體驗。所需資源: Vue 3 官方文檔 (<KeepAlive>): https://cn.vuejs.org/guide/built-ins/…

SpringBean模塊(三)具有生命周期管理能力的類(1)AutowireCapableBeanFactory

一、介紹 1、簡介 AutowireCapableBeanFactory 是 Spring 框架中的一個接口&#xff0c;位于 org.springframework.beans.factory 包下&#xff0c;它提供了更底層的 Bean 實例化、依賴注入和生命周期管理能力&#xff0c;即使這些 Bean 沒有通過常規的 Component 或 XML 注冊…

Service Mesh

目錄 一、Service Mesh 的核心特點 二、Service Mesh 的典型架構 1. Sidecar 模式 2. 控制平面與數據平面分離 三、Service Mesh 解決的核心問題 四、典型應用場景 五、主流 Service Mesh 框架對比 六、挑戰與局限性 七、未來趨勢 總結 Istio 一、Istio 核心組件與…