論文閱讀筆記：Generative Modeling by Estimating Gradients of the Data Distribution

1、參考來源

論文《Generative Modeling by Estimating Gradients of the Data Distribution》
來源：NeurIPS 2019
論文鏈接：https://arxiv.org/abs/1907.05600
參考鏈接：
【AI知識分享】真正搞懂擴散模型Score Matching一定要理解的三大核心問題

2、布朗運動

布朗運動是描述花粉微粒在水中的運動情況的。可以看出，花粉微粒在水中的受力情況如下所示。因此根據牛頓第二定律，
$\begin{equation} \begin{split} F&=ma\\ m\cdot\frac{dv_t}{dt}&= F_{合力}\\ &=F_{摩擦力}+F_{碰撞力}\\ &=-\gamma\cdot v_t+\eta \end{split} \end{equation}$
其中， $\gamma$ 是摩擦力因子。 $\eta$ 是碰撞力，也是一個隨機的力，滿足高斯分布， $\eta \sim N(0,\sigma^2)$ 。
請添加圖片描述

花粉微粒包含的總能量 $E_{\omega}$ 包含動能 $E$ 和勢能 $U$ 。在合力的作用下，動能和勢能相互轉化，且總能量保持不變。動能定理，可以得到
$\begin{equation} \begin{split} F_{合力}\cdot \Delta x&=\Delta E\\ &\Updownarrow\\ F_{合力}&=\frac{\Delta E}{\Delta x}\\ &=\frac{\Delta E_{\omega}-\Delta U}{\Delta x}\\ &=\frac{-\Delta U}{\Delta x} \end{split} \end{equation}$

其中， $x$ 為位移。由于花粉微粒的總能力 $E_{\omega}$ 保持不變，因此 $\frac{\Delta E_{\omega}}{\Delta x}=0$ 。
另一方面，花粉微粒在水中的分布，服從波爾茲曼分布。
$\begin{equation} \begin{split} P(x)=\frac{e^{-U(x)}}{z} \end{split} \end{equation}$
其中 $U (x)$ 表示在位置 $x$ 處的花粉微粒所具有的勢能。 $z$ 是一個歸一化因子。也就是說，具有勢能越大的花粉，其對應的概率密度越小。波爾茲曼分布是描述粒子的熱運動的。玻爾茲曼分布體現了系統的穩定性傾向。系統中的粒子總是趨向于占據能量較低的狀態，因為低能量狀態更穩定。但由于熱運動的存在，粒子也有一定的概率處于較高能量的狀態，不過這種概率會隨著能量的升高而迅速減小。探秘玻爾茲曼分布：解鎖微觀粒子能量分布的神奇密碼

對公式（3）的兩邊分別取對數且求導
$\begin{equation} \begin{split} \nabla_x log\big(P(x)\big)&=\nabla_x log \frac{e^{-U(x)}}{z} \\ &=\nabla_x-U(x) \\ &=F_{合力} \\ &=-\gamma\cdot v_t+\eta\\ &=-\gamma\cdot \frac{dx}{dt}+\eta \\ &\Updownarrow \\ dx&=-\frac{dt}{\gamma}\nabla_x log\big(P(x)\big) + \frac{\eta}{\gamma} \cdot dt \\ &\Updownarrow \\ x_{t+\Delta t}&=x_{t}-\frac{\Delta t}{\gamma}\nabla_x log\big(P(x)\big) + \frac{\Delta t}{\gamma} \cdot \eta\\ &=x_{t}-\frac{\Delta t}{\gamma}\nabla_x log\big(P(x)\big) + \frac{\Delta t}{\gamma} \cdot \sigma \cdot z\\ \end{split} \end{equation}$
其中， $z\sim N(0,1)$ 。如果分別令 $\frac{\Delta t}{\gamma}=\frac{\epsilon}{2}$ ， $\frac{\Delta t}{\gamma} \cdot \sigma=\sqrt{\epsilon}$ 。公式(4)則變為
$\begin{equation} \begin{split} x_{t+\Delta t}=x_{t}-\frac{\epsilon}{2}\nabla_x log\big(P(x)\big) + \sqrt{\epsilon} \cdot z\\ \end{split} \end{equation}$
對于下圖中的概率分布來說，對于在 $x_0$ 處的花粉微粒來說，其對應的斜率是負數，對應于公式(4)中的 $\nabla_x log\big(P(x)\big)$ 是負數。因此，相對于 $x_{t}$ ， $x_{t+\Delta t}$ 大概率會增大，因為是存在一個隨機高斯分布 $\eta$ ；對于在 $x_1$ 處的花粉微粒來說，其對應的斜率是正數，對應于公式(4)中的 $\nabla_x log\big(P(x)\big)$ 是正數。因此，相對于 $x_{t}$ ， $x_{t+\Delta t}$ 大概率會減小。綜上所述，花粉微粒大概率會朝向密度低的位置移動。這是符合墨水滴入水中的運動常識的。
請添加圖片描述
論文《Generative Modeling by Estimating Gradients of the Data Distribution》中的公式如公式（6）所示。可以看出，論文中的公式（6）是花粉擴散過程的逆過程
$\begin{equation} \begin{split} x_{t+\Delta t}=x_{t}+\frac{\epsilon}{2}\nabla_x log\big(P(x)\big) + \sqrt{\epsilon} \cdot z\\ \end{split} \end{equation}$

2、正篇

圖像生成別只知道擴散模型(Diffusion Models)，還有基于梯度去噪的分數模型：

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/77532.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/77532.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/77532.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！