Ctrl-Crash 助力交通安全:可控生成逼真車禍視頻,防患于未然

視頻擴散技術雖發展顯著,但多數駕駛數據集事故事件少,難以生成逼真車禍圖像,而提升交通安全又急需逼真可控的事故模擬。為此,論文提出可控車禍視頻生成模型 Ctrl-Crash,它以邊界框、碰撞類型、初始圖像幀等為條件,能生成反事實場景,輸入微小變動就可能引發截然不同的碰撞結果。

生成不同碰撞類型的場景

這些示例說明了針對多種不同碰撞類型(描述哪些參與者涉及碰撞)的場景:

事故重建

僅使用初始地面真實幀和所有邊界框幀作為輸入,通過 Ctrl-Crash 預測的碰撞:

碰撞預測

使用初始幀和前 9 個邊界框幀作為輸入,通過 Ctrl-Crash 預測崩潰(白色幀表示邊界框被遮罩):

從非崩潰數據生成崩潰

通過調節初始幀和前 9 個邊界框幀,從非事故 BDD100K 數據集生成碰撞:

相關鏈接

  • 論文:https://arxiv.org/pdf/2506.00227

  • 代碼:https://github.com/AnthonyGosselin/Ctrl-Crash

  • 試用:https://huggingface.co/AnthonyGosselin/Ctrl-Crash

論文介紹

 Ctrl-Crash:可控擴散,實現逼真的車禍場景

近年來,視頻擴散技術取得了顯著進展;然而,由于大多數駕駛數據集中事故事件的稀缺,它們難以生成逼真的車禍圖像。提高交通安全需要逼真且可控的事故模擬。

為了解決這個問題,論文提出了 Ctrl-Crash,這是一個可控的車禍視頻生成模型,它以邊界框、碰撞類型和初始圖像幀等信號為條件。提出的方法能夠生成反事實場景,其中輸入的微小變化都可能導致截然不同的碰撞結果。為了支持推理時的細粒度控制,作者利用無分類器引導,每個調節信號都有獨立可調的尺度。與之前基于擴散的方法相比,Ctrl-Crash 在定量視頻質量指標(例如 FVD 和 JEDi)和基于人工評估的物理真實感和視頻質量的定性測量方面均實現了最佳性能。

方法概述

Ctrl-Crash 是一個可控的視頻擴散框架,旨在通過空間和語義控制信號的引導,從單個初始幀生成逼真的車禍場景。Ctrl-Crash 基于 Ctrl-V (一個用于從渲染的邊界框軌跡生成視頻的框架),將其功能擴展到特定于車禍的場景,從而提供更豐富的控制和更大的靈活性。具體而言,論文引入了一種新的語義控制信號來表示車禍類型,并引入了一種改進的訓練程序來處理部分和噪聲條件。

實驗結果

AVD2、DrivingGen、Ctrl-V 和 Ctrl-Crash 的定性結果比較。AVD2 生成的碰撞畫面視覺上抖動,場景通常缺乏一致性。Driving-Gen 生成的視頻質量低下且不連貫。雖然 Ctrl-V 實現了良好的視覺質量,但它無法生成逼真的碰撞事件。相比之下,Ctrl-Crash 在視覺保真度和場景一致性方面均優于所有基準,同時能夠準確地建模碰撞動力學。

結論

Ctrl-Crash是一個可控的視頻擴散框架,它能夠從單幀生成逼真的車禍場景,在基于擴散的方法中達到了最佳性能,并通過改變空間和語義控制輸入實現反事實推理。為了支持訓練和評估,還開發了從車禍視頻中提取邊界框的處理流程,并發布了 MM-AU、RussiaCrash 和 BDD100k 的精選注釋版本,以促進未來車禍模擬和生成式建模的研究。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84225.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84225.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84225.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

jieba實現和用RNN實現中文分詞的區別

Jieba 分詞和基于 RNN 的分詞在技術路線、實現機制、性能特點上有顯著差異,以下是核心對比: 1. 技術路線對比 維度Jieba 分詞RNN 神經網絡分詞范式傳統 NLP(規則 統計)深度學習(端到端學習)核心依賴詞典…

excel數據對比找不同:6種方法核對兩列數據差異

工作中,有時需要核對兩列數據的差異,用于對比、復核等。數據較少的情況下差異肉眼可見,數據量較大時用什么方法比較好呢?從個人習慣出發,我整理了6種方法供參考。 6種方法核對兩列數據差異: 1、Ctrl G定位…

C# 表達式和運算符(求值順序)

求值順序 表達式可以由許多嵌套的子表達式構成。子表達式的求值順序可以使表達式的最終值發生 變化。 例如,已知表達式3*52,依照子表達式的求值順序,有兩種可能的結果,如圖9-3所示。 如果乘法先執行,結果是17。如果5…

高頻面試之3Zookeeper

高頻面試之3Zookeeper 文章目錄 高頻面試之3Zookeeper3.1 常用命令3.2 選舉機制3.3 Zookeeper符合法則中哪兩個?3.4 Zookeeper腦裂3.5 Zookeeper用來干嘛了 3.1 常用命令 ls、get、create、delete、deleteall3.2 選舉機制 半數機制(過半機制&#xff0…

CppCon 2015 學習:Simple, Extensible Pattern Matching in C++14

什么是 Pattern Matching(模式匹配) ? 模式匹配就是一種“描述式”的寫法,不需要你手動判斷、提取數據,而是直接描述你希望的數據結構是什么樣子,系統自動判斷并提取。? 你給的定義拆解: ? Instead of …

刷題記錄(7)二叉樹

一、單值二叉樹 二叉樹為二叉鏈表形式,結點為: 大概看看題就知道這道題讓我們判斷一個樹到底所有結點的值是不是相同,相同就是單值二叉樹。在實現二叉樹相關操作的時候已經體會到了,遞歸來遍歷二叉樹是非常舒服的(做這…

開源:FTP同步工具

文章目錄 簡介功能特性Windows (EXE)從源代碼構建依賴項Linux 構建Windows 構建 使用方法軟件截圖主界面FTP 設置快捷菜單定時設置 配置說明開發與貢獻許可證 歡迎來到盹貓的博客 本篇文章主要介紹了 [開源:FTP同步工具] ?博主廣交技術好友,喜歡我的文章的可以關注…

視頻質量測試點

目錄 功能/UI 端側性能 媒體質量 主觀 客觀 穩定性 兼容性 功能/UI 視頻預覽音頻預覽音視頻同步全屏收藏打賞 端側性能 PC端:內存占用、網絡帶寬占用等; 移動端:內存占用、功耗、發熱、流量消耗等; 媒體質量 主觀 音…

Ray框架:分布式AI訓練與調參實踐

Ray框架:分布式AI訓練與調參實踐 系統化學習人工智能網站(收藏):https://www.captainbed.cn/flu 文章目錄 Ray框架:分布式AI訓練與調參實踐摘要引言框架架構解析1. 核心組件設計2. 關鍵技術實現2.1 動態資源調度2.2 …

成都鼎訊硬核科技!雷達目標與干擾模擬器,以卓越性能制勝電磁頻譜戰

在現代戰爭中,電磁頻譜已成為繼陸、海、空、天之后的 “第五維戰場”,雷達作為電磁頻譜領域的關鍵裝備,其干擾與抗干擾能力的較量,直接影響著戰爭的勝負走向。由成都鼎訊科技匠心打造的雷達目標與干擾模擬器,憑借數字射…

ubuntu22.04 安裝docker 和docker-compose

首先你要確保沒有docker環境或者使用命令刪掉docker sudo apt-get remove docker docker-engine docker.io containerd runc安裝docker 更新軟件環境 sudo apt update sudo apt upgrade下載docker依賴和GPG 密鑰 # 依賴 apt-get install ca-certificates curl gnupg lsb-rel…

2025 后端自學UNIAPP【項目實戰:旅游項目】6、我的收藏頁面

代碼框架視圖 1、先添加一個獲取收藏景點的列表請求 【在文件my_api.js文件中添加】 // 引入公共的請求封裝 import http from ./my_http.js// 登錄接口(適配服務端返回 Token) export const login async (code, avatar) > {const res await http…

20250609在榮品的PRO-RK3566開發板的Android13下解決串口可以執行命令但是腳本執行命令異常的問題

20250609在榮品的PRO-RK3566開發板的Android13下解決串口可以執行命令但是腳本執行命令異常的問題 2025/6/9 20:54 緣起,為了跨網段推流,千辛萬苦配置好了網絡參數。 但是命令iptables -t filter -F tetherctrl_FORWARD可以在調試串口/DEBUG口正確執行。…

【C/C++】高效的位操作

位運算(Bitwise Operation)是直接對整數的二進制位進行操作的運算方式,在底層開發、性能優化、算法設計中廣泛使用。 1 基本位運算符及含義 運算符名稱示例(a5, b3)運算過程(二進制)結果&按…

后端下載限速(redis記錄實時并發,bucket4j動態限速)

? 使用 Redis 記錄 所有用戶的實時并發下載數? 使用 Bucket4j 實現 全局下載速率限制(動態)? 支持 動態調整限速策略? 下載接口安全、穩定、可監控 🧩 整體架構概覽 模塊功能Redis存儲全局并發數和帶寬令牌桶狀態Bucket4j Redis分布式限…

android app 一個 crash的解決過程!

一、日志: crash 2024-10-25 12:15:33.020 2113-2113 AndroidRuntime pid-2113 E FATAL EXCEPTION: main Process: com..workhome, PID: 2113 java.lang.RuntimeException: Unable to start activity ComponentInfo{com..w…

[Java 基礎]Object 類

java.lang.Object 是 Java 所有類的直接或間接父類,Java 中每個類都默認繼承 Object 類(即使你沒寫 extends Object)。 Object 中的常用方法: 方法名功能簡介toString()返回對象的字符串表示equals(Object)判斷兩個對象是否“邏…

大數據學習(135)-Linux系統性指令

🍋🍋大數據學習🍋🍋 🔥系列專欄: 👑哲學語錄: 用力所能及,改變世界。 💖如果覺得博主的文章還不錯的話,請點贊👍收藏??留言📝支持一…

【Fifty Project - D35】

今日完成記錄 TimePlan完成情況7:00 - 7:40爬坡√8:30 - 11:30Rabbit MQ√17:30 - 18:30羽毛球√ RabbitMQ 消費者端如何保證可靠性? 消息投遞過程出現網絡故障消費者接收到消息但是突然宕機…

P3 QT項目----記事本(3.4)

3.4 文件選擇對話框 QFileDialog 3.4.1 QFileDialog 開發流程 使用 QFileDialog 的基本步驟通常如下: 實例化 :首先,創建一個 QFileDialog 對象的實例。 QFileDialog qFileDialog;設置模式 :根據需要設置對話框的模式&…