(2024,SDE,對抗薛定諤橋匹配,離散時間迭代馬爾可夫擬合,去噪擴散 GAN)

Adversarial Schr?dinger Bridge Matching

公眾號:EDPJ(進 Q 交流群:922230617 或加 VX:CV_EDPJ 進 V 交流群)?

目錄

0. 摘要

1. 簡介

4. 實驗


0. 摘要

薛定諤橋(Schr?dinger Bridge,SB)問題提供了一個結合最優輸運(optimal transport)和擴散模型的強大框架。一個解決 SB 問題的有前景的新方法是迭代馬爾可夫擬合(Iterative Markovian Fitting,IMF),它在連續時間隨機過程的馬爾可夫和倒向投影(reciprocal projection)之間交替。然而,由于使用了許多步的隨機微分方程數值求解器,IMF 程序構建的模型推理時間較長。為了解決這個限制,我們提出了一種新的離散時間 IMF(D-IMF),其中隨機過程的學習被替換為僅在離散時間內學習幾個轉移概率。其主要優點是它在實踐中可以自然地通過去噪擴散 GAN(DD-GAN)實現,這是一種已經很成熟的對抗生成建模技術。我們展示了我們的 D-IMF 程序可以在僅用幾步生成代替數百步生成的情況下,提供與 IMF 相同質量的無監督域遷移。

(2022|ICLR,擴散 GAN,少量步擴散,對抗散度,非飽和 GAN)用去噪擴散 GAN 解決生成學習難題_高樣本質量、模式覆蓋和快速采樣-CSDN博客?

1. 簡介

貢獻。本論文通過引入一種新方法來學習薛定諤橋(Schr?dinger Bridge),解決了現有迭代馬爾可夫擬合(IMF)框架推理時間較長的限制。

  • 理論 I。我們引入了離散迭代馬爾可夫擬合(D-IMF)(sec. 3.2, 3.3),創新性地應用離散馬爾可夫投影來解決薛定諤橋問題,而不依賴隨機微分方程。這一方法顯著簡化了推理過程,使其在理論上僅需幾步評估即可完成。

  • 理論 II。我們推導了處理高維高斯分布時 D-IMF 程序的閉式(closed-form)更新公式。這一進展允許對我們方法的收斂率進行詳細的實證分析,并增強其理論基礎(sec. 3.4, 4.1)。

  • 實踐。對于通過樣本獲得的一般數據分布,我們提出了一種算法(Adversarial Schr?dinger Bridge Matching,ASBM)來實際實現離散馬爾可夫投影和我們的 D-IMF(sec. 4.2)。我們的算法基于對抗學習和去噪擴散 GAN [49]。我們學習的 SB 模型在推理中僅使用 4 步評估(sec. 3.5),而不是基礎 IMF [43] 的數百步。

4. 實驗

我們通過使用 sec. 3.4 中的 D-IMF 解析公式進行實驗。我們遵循 [12] 中的設置,并考慮維度 D = 16 和 ?∈{1,3,10} 的中心高斯分布 p0=N(0,Σ0) 和 p1=N(0,Σ1) 的薛定諤橋問題。?

我們發現,在所有情況下,我們的 D-IMF 過程顯示出指數級的收斂速度。如圖 2a 所示,收斂速度對時間步 N 的依賴性迅速飽和。因此,即使只有幾個時間點,例如 N = 5,也能提供快速的收斂速度。從圖 2b 可以明顯看出,收斂速度受參數 ? 的選擇影響很大。例如,從 ?=1 到 ?=10 的過渡需要多十倍的 D-IMF 迭代次數。因此,這個超參數在實際問題中可能非常重要。?

Diffusion schr?dinger bridge matching(DSBM)?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/15926.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/15926.shtml
英文地址,請注明出處:http://en.pswp.cn/web/15926.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

el-autocomplete后臺遠程搜索

el-complete可以實現后臺遠程搜索功能,但有時傳入數據為空時,接口可能會報錯。此時可在querySearchAsync方法中,根據queryString判斷,若為空,則不掉用接口,直接callback([]),反之則調用接口&…

浮點型比較大小

浮點數的存儲形式 浮點數按照在內存中所占字節數和數值范圍,可以分為浮點型,雙精度浮點型和長雙浮點型數。 代碼: printf("lgn:%e \n", pow(exp(1), 100));printf("lgn:%f ", pow(exp(1), 100));輸出結果: …

Stanford斯坦福 CS 224R: 深度強化學習 (5)

離線強化學習:第一部分 強化學習(RL)旨在讓智能體通過與環境交互來學習最優策略,從而最大化累積獎勵。傳統的RL訓練都是在線(online)進行的,即智能體在訓練過程中不斷與環境交互,實時生成新的狀態-動作數據,并基于新數據來更新策略。這種在線學習雖然簡單直觀,但也存在一些局限…

【Could not find Chrome This can occur if either】

爬蟲練習中遇到的問題 使用puppeteer執行是提示一下錯誤 Error: Could not find Chrome (ver. 125.0.6422.78). This can occur if either you did not perform an installation before running the script (e.g. npx puppeteer browsers install chrome) oryour cache path…

CLIP 論文的關鍵內容

CLIP 論文整體架構 該論文總共有 48 頁,除去最后的補充材料十頁去掉,正文也還有三十多頁,其中大部分篇幅都留給了實驗和響應的一些分析。 從頭開始的話,第一頁就是摘要,接下來一頁多是引言,接下來的兩頁就…

常用 CSS 寫法

不是最后一個 :not(:last-child)漸變色 background: linear-gradient(270deg, #15aaff 0%, #02396a 100%);文字漸變色 background-image: linear-gradient(to right, #ff7e5f, #feb47b); -webkit-background-clip: text; background-clip: text; color: transparent;

python文件IO基礎知識

目錄 1.open函數打開文件 2.文件對象讀寫數據和關閉 3.文本文件和二進制文件的區別 4.編碼和解碼 讀寫文本文件時 讀寫二進制文件時 5.文件指針位置 6.文件緩存區與flush()方法 1.open函數打開文件 使用 open 函數創建一個文件對象,read 方法來讀取數據&…

談談磁盤的那些操作

磁盤格式化 是指把一張空白的盤劃分成一個個小區域并編號,以供計算機存儲和讀取數據。格式化是一種純物理操作,是在磁盤的所有數據區上寫零的操作過程,同時對硬盤介質做一致性檢測,并且標記出不可讀和壞的扇區。由于大部分硬盤在…

電子技術學習路線

在小破站上看到大佬李皆寧的技術路線分析,再結合自己這幾年的工作。發現的確是這樣,跟著大佬的技術路線去學習是會輕松很多,現在想想,這路線其實跟大學四年的學習順序是很像的。 本期記錄學習路線,方便日后查看。 傳統…

python 深度圖生成點云(方法二)

深度圖生成點云 一、介紹1.1 概念1.2 思路1.3 函數講解二、代碼示例三、結果示例接上篇:深度圖生成點云(方法1) 一、介紹 1.1 概念 深度圖生成點云:根據深度圖像(depth image)和相機內參(camera intrinsics)生成點云(PointCloud)。 1.2 思路 點云坐標的計算公式如…

pillow學習7

繪制驗證碼 from PIL import Image,ImageFilter,ImageFont,ImageDraw import random width100 hight100 imImage.new(RGB,(width,hight),(255,255,255)) drawImageDraw.Draw(im) #獲取顏色 def get_color1():return (random.randint(200, 255), random.randint(200, 255), ran…

京東Java社招面試題真題,最新面試題

Java中接口與抽象類的區別是什么? 1、定義方式: 接口是完全抽象的,只能定義抽象方法和常量,不能有實現;而抽象類可以有抽象方法和具體實現的方法,也可以定義成員變量。 2、實現與繼承: 一個類…

幾種常用的配置文件格式對比分析——ini、json、xml、toml、yaml

配置文件用于存儲軟件程序的配置信息,以便程序能夠根據這些信息進行自定義和調整。常用的配置文件格式包括INI、XML、JSON和YAML。下面對它們進行簡單介紹,并分析各自的優缺點。 1. INI 文件格式 簡介: INI(Initialization&…

FPGA之tcp/udp

在調試以太網的過程中,考慮了vivado IP配置(管腳、reset等),SDK中PHY芯片的配置(芯片地址、自適應速率配置等),但是,唯獨忽略了tcp/udp協議,所以在ping通之后仍無法連接。 所以現在來學習一下tcp與udp的區別 ---- 為什…

經典面試題:進程、線程、協程開銷問題,為什么進程切換的開銷比線程的大?

上下文切換的過程? 上下文切換是操作系統在將CPU從一個進程切換到另一個進程時所執行的過程。它涉及保存當前執行進程的狀態并加載下一個將要執行的進程的狀態。下面是上下文切換的詳細過程: 保存當前進程的上下文: 當操作系統決定切換到另…

浪潮信息IPF24:AI+時代,創新驅動未來,攜手共創智慧新紀元

如今,數字化時代的浪潮席卷全球,人工智能已經成為推動社會進步的重要引擎。浪潮信息IPF24作為行業領先的AI技術盛會,不僅為業界提供了交流合作的平臺,更在激發創新活力、拓展發展路徑、加速AI技術落地等方面發揮了重要作用。 升級…

OS復習筆記ch6-2

死鎖的解決 死鎖的預防(打疫苗)死鎖的避免(戴口罩)死鎖的檢測(做核酸) 死鎖的預防 前面我們提到了死鎖的四個必要條件 防止前三個必要條件,就是間接預防防止最后一個必要條件–循環等待&…

軟測刷題-錯題1

提高測試效率的方法: 1、不要做無效的測試 2.不要做重復的測試 3.不同測試版本的測試側重點 4.優化測試順序 LoadRunner是對服務器進行施壓。 在數據庫中存在的用戶數是指注冊用戶數。 input標簽可以直接使用send_keys實現上傳,而非input標簽是無法直…

Rust后臺管理系統Salvo-admin源碼編譯

1.克隆salvo-admin后臺管理系統源碼: https://github.com/lyqgit/salvo-admin.git 2.編譯 編譯成功 3.創建mysql數據庫與執行sql腳本 輸入名稱ry-vue 執行sql腳本 全部執行上面3個sql 修改數據庫用戶名與密碼: 清理及重新編譯 cargo clean cargo build 4.運行并測試 cargo…

Android內存碎片化調優

概念 內存碎片分為兩種,一種是內存頁中的碎片,被稱為內部碎片;另一種是空閑分散的內存頁,湊不齊一個組物理地址連續的空閑內存頁,就沒辦法分配了,這些散落的內存頁被稱為外部碎片。 在Android系統中,內存碎片化是指內存中存在很多小塊的空閑內存,這些內存塊之間不連續…