Sora 原理與技術實戰筆記一

b 站視頻合集
【AI+X組隊學習】Sora原理與技術實戰:Sora技術路徑詳解
Sora 技術報告(OpenAI)
huggingsd 文生圖視頻系列的一個開源項目
最強視頻生成模型Sora相關技術解析
https://github.com/lichao-sun/SoraReview

驚艷效果:

  • 長視頻
  • 高清
  • 視頻融合能力
  • 同一場景的多角度/鏡頭的生成能力

TeText-to-video: 文生視頻
Image-to-video: 圖生視頻
Video-to-video: 改變源視頻風格or場景
Extending video in time: 視頻拓展(前后雙向)
Create seamless loops: Tiled videos that seem like they never endImage generation: 圖片生成 (size最高達到 2048 x 2048)
Generate video in any foformat: From 1920 x 1080 to 1080 x 1920 視頻輸出比例自定義
Simulate virtual worlds: 鏈接虛擬世界,游戲視頻場景生成Create a video: 長達60s的視頻并保持人物、場景一致性

要做世界模擬器。
在這里插入圖片描述

DDPM 擴散模型
ViT 把完整的圖片 Patch 化,把單個圖片的patch 序列化。

為了處理視頻,提出了 ViViT,用 Transformers 來處理視頻的一個模型.
在這里插入圖片描述
包含時空信息的patch。
如何進行樣本取樣?

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

Sora, 通過 patch,預測下一個patch,構建一個自回歸的方式來進行的。而不是之前那種預測關鍵幀,插幀的方式。
DALLE 2 也是通過文本的方式。

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/712088.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/712088.shtml
英文地址,請注明出處:http://en.pswp.cn/news/712088.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Linux】screen

文章目錄 一、screen二、功能三、使用3.1 安裝3.2 常用參數3.3 狀態3.4 使用3.4.1 終端列表3.4.2 新建screen3.4.3 detached3.4.4 回到終端3.4.5 清除終端 一、screen screen為多視窗管理程序。在服務器上搭建一些服務的時候,經常要用到screen命令。例如某些服務開…

云吶智能運維包含哪些內容?運維未來的發展方向是什么?

智能運維(AIOps)是一種使用人工智能應用程序來調節IT操作和維護的實踐方式。它結合了大數據和機器學習技術,旨在自動化和改進IT操作和維護任務,如故障檢測、因果分析和自動故障修復。以下是智能操作和維護的具體內容、挑戰和解決方…

使用Node.js構建一個簡單的聊天機器人

當談到人工智能,我們往往會想到什么?是智能語音助手、自動回復機器人等。在前端開發領域中,我們也可以利用Node.js來構建一個簡單而有趣的聊天機器人。本文將帶你一步步實現一個基于Node.js的聊天機器人,并了解其工作原理。 首先…

文生圖項目總結

文生圖 功能點 頁面進來獲取背景圖url和圖片寬高(根據比例和手機屏幕處理過的寬高)渲染圖片(背景圖最后生成圖片模糊,換成img展示解決)添加多個文字,編輯文字內容,拖拽改變文字位置&#xff0c…

上云還是下云,最大挑戰是什么?| 對話章文嵩、畢玄、王小瑞

近半年來,公有云領域頻頻發生阿里云、滴滴等平臺崩潰事件,與此同時,馬斯克的“X 下云省錢”言論引起了廣泛關注,一時間,“上云”和“下云”成為熱議話題。在最近舉辦的 AutoMQ 云原生創新論壇上,AutoMQ 聯合…

大數據可視化python01

import pandas as pd import matplotlib.pyplot as plt# 設置中文改寫字體 plt.rcParams[font.sans-serif] [SimHei]# 讀取數據 data pd.read_csv(C:/Users/wzf/Desktop/讀取數據進行數據可視化練習/實訓作業練習/瓜果類單位面積產量.csv ,encoding utf-8)#輸出 print(data)…

springcloud alibaba組件簡介

一、Nacos 服務注冊中心/統一配置中心 1、介紹 Nacos是一個配置中心,也是一個服務注冊與發現中心。 1.1、配置中心的好處: (1)配置數據脫敏 (2)防止出錯,方便管理 (3&#xff…

一本通 1403:素數對

在判斷素數對的兩個數是否都為素數時可以只判斷數的一半 #include<bits/stdc.h> using namespace std; bool su(int a,int b){ for(int i2;i<sqrt(a);i){ if(a%i0){ return 0; } } for(int i2;i<sqrt(b);i){ if(…

AI大預言模型——ChatGPT在地學、GIS、氣象、農業、生態、環境等應用

原文鏈接&#xff1a;AI大預言模型——ChatGPT在地學、GIS、氣象、農業、生態、環境等應用 一開啟大模型 1 開啟大模型 1)大模型的發展歷程與最新功能 2)大模型的強大功能與應用場景 3)國內外經典大模型&#xff08;ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Di…

Java底層自學大綱_中間件原理篇

中間件原理專題_自學大綱所屬類別學習主題建議課時&#xff08;h&#xff09; A Web服務器Tomcat8原理分析001 Tomcat8底層架構模式2.5 A Web服務器Tomcat8原理分析002 Tomcat8底層源碼深度分析2.5 A Web服務器Tomcat8原理分析003 站在微服務架構角度優化Tomcat82.5 B 分布…

SpringMVC基礎概述

目錄 MVC核心組件RequestMapping注解域對象共享數據視圖RESTful請求與響應HttpMessageConverter請求響應 攔截器配置異常處理基于配置的異常處理基于注解的異常處理 配置類與注解配置MVC執行流程 Spring MVC是Spring Framework提供的Web組件&#xff0c;全稱是Spring Web MVC&a…

ConcurrentHashMap的演進:從Java 8之前到Java 17的實現原理深度剖析

目錄 一、引言二、Java 8之前的ConcurrentHashMap1、內部結構與初始化2、Segment類3、并發控制4、擴容與重哈希5、總結 三、Java 8中的ConcurrentHashMap1、數據結構2、并發控制2.1. CAS操作2.2. synchronized同步塊 3、哈希計算與定位4、擴容與重哈希5、總結 四、Java 17中的C…

廣汽埃安工廠:蔚來汽車的造車工廠有哪些?

具體來說&#xff0c;理想汽車目前在常州僅有一家汽車制造工廠。 一期項目于2017年12月竣工&#xff0c;2019年12月投產&#xff0c;年產能10萬輛/年。 同時&#xff0c;正在規劃二期工程。 產能將增至20萬輛/年。 此外&#xff0c;理想還計劃接管現代汽車在北京順義的第一家工…

抖音小店怎么開店注冊?別在全網找教程了,2024年最新開店教程來了

大家好&#xff0c;我是電商糖果 想開一家抖音小店&#xff0c;不會開&#xff0c;也不懂需要準備哪些材料。 在網上扒拉了一堆教程&#xff0c;不知道應該聽哪個&#xff1f; 害怕店鋪開錯了&#xff0c;后續還要關店。 有這些擔心的朋友&#xff0c;看到這篇文章的時候&a…

工業現場網絡性能評估方案

最近要去一個工廠排查網絡和電腦卡頓的問題,為此&#xff0c;我準備了以下的方案&#xff0c;在現場以抓包和網絡監控的方式來排查。 1.評估流程 為了評估Linux系統的網絡負荷&#xff0c;并使用tcpdump來捕獲數據包進行分析&#xff0c;您需要遵循以下幾個步驟&#xff1a; …

自動化搭建---環境搭建與配置

1. 確定所需環境 與項目團隊和開發人員詳細溝通&#xff0c;了解項目的具體環境需求。這可能包括操作系統版本、數據庫類型&#xff08;如MySQL、PostgreSQL等&#xff09;、Web服務器&#xff08;如Apache、Nginx等&#xff09;以及其他依賴軟件。 2. 安裝操作系統 根據項目…

數據倉庫與數據挖掘概述

目錄 一、數據倉庫概述 &#xff08;一&#xff09;從傳統數據庫到數據倉庫 &#xff08;二&#xff09;數據倉庫的4個特征 &#xff08;三&#xff09;數據倉庫系統 &#xff08;四&#xff09;數據倉庫系統體系結構 &#xff08;五&#xff09;數據倉庫數據的粒度與組織…

論文閱讀_代碼生成模型_CodeGeeX

英文名稱: CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Evaluations on HumanEval-X 中文名稱: CodeGeeX&#xff1a;一種用于代碼生成的預訓練模型&#xff0c;并在HumanEval-X上進行多語言評估 鏈接: https://arxiv.org/abs/2303.17568 代碼: http…

無處不在的智慧:嵌入式系統引領智能生活

無處不在的智慧&#xff1a;嵌入式系統引領智能生活 嵌入式系統作為智能生活的重要組成部分&#xff0c;正逐漸滲透到我們的日常生活中&#xff0c;引領著智能生活的發展。以下將從多個方面對嵌入式系統在智能生活中的引領作用進行詳細論述。 智能家居中的嵌入式系統應用 嵌…

訓練1 : 老頭

以前用blender做的特效 總結 頭發很費時間, 需要參考和練習眼窩周邊結構還有些待準確把握從光與影中揣摩輪廓形狀 從少量面掌握大體, 從多數面雕刻細節