大量數據+同步+多線程_Vulkan 多線程渲染

1. Overview of Vulkan

1.1 計算機圖形軟件

圖形軟件有兩個大類：專用軟件包（special-purpose packages）和通用編程軟件包（general programming packages）。

專用軟件包通常提供一種UI設計語言，讓用戶直接生成想要的圖形，不用關心內部實現。這類軟件例子是PS、CAD等等。

相反，通用編程軟件包提供一個可使用C、C++或Java等高級語言編程的圖形函數庫。圖形函數庫中提供幾何圖元、矩陣變換等操作，提供了間接操作硬件的軟件接口，所以這組圖形函數又被稱為計算機圖形應用編程接口（computer-graphics application programming interface，CG API）。OpenGL、Vulkan、DirectX、Metal皆在此列。

1.2 Vulkan多線程的設計理念

Vulkan不僅僅是圖形（graphics）API，而是一個面向圖形和計算的編程接口（graphics and compute）。支持Vulkan的設備可以是GPU，也可以是DSP或者固定功能的硬件。

Vulkan中的計算模型主要基于并行計算，因此支持多線程是Vulkan設計的核心理念之一。

為了較少Vulkan內部因為互斥同步等操作造成的卡頓問題，Vulkan內部默認認為對任何資源的訪問不存在多線程競爭，所有的資源同步操作由應用開發者去負責，因為對資源的訪問和使用沒有人比應用開發者自己更加清楚。Vulkan稱之為外部同步（external synchronization）。

因為這個原因，資源管理和線程同步工作成為編寫Vulkan程序的最大難點之一。想要讓Vulkan多線程正常運行，你需要做大量的工作。當然，換來的是Vulkan有了更加干凈的線程模型以及比其它CG API高得多的性能。

image-20200730105359314.png

1.3. Instances, Devices, and Queues

在正式研究Vulkan多線程之前，有三個重要的基礎概念需要了解—Instances, Devices, and Queues。

Instances可以看做是應用的子系統，從邏輯上把Vulkan與應用程序上下文中的其他邏輯隔開。Instances可以看做是Vulkan的上下文，它會跟蹤所有狀態，從邏輯上把所有支持Vulkan的設備整合在一起。

Devices有兩個概念：Physical devices和Logical device。

Physical devices通常代表一個或者多個支持Vulkan的硬件設備，這些設備具有特定功能，可以提供一系列Queues。圖形顯卡、加速器、DSP等都可以是Vulkan的Physical devices。

Logical device是Physical devices的軟件抽象，用于預訂一些硬件資源。

Queues可以理解為一個“GPU線程”，它是實現Vulkan多線程的關鍵元素之一，用于響應應用的請求，大部分時間，應用都在與其交互。

Vulkan功能的層次結構圖如下：

image-20200730105801733.png

2. Queues and Command Buffer

2.1 Queues

Queue代表一個GPU線程，Vulkan設備執行的就是提交到Queues中的工作。物理設備中Queue可能不止一個，每一個Queue都被包含在Queue Families中。

Queue Families是一個有相同功能的Queues的集合，它們的性能水平和對系統資源的訪問是相同的，并且在它們之間數據傳輸工作沒有任何成本（同步之外）。

一個物理設備中可以存在多個Queue Families，不同的Queue Families有不同的特性。相同Queue Families中的Queues的功能相同，并且可以并行運行。

按照Queue的能力，可以將其劃分為：

Graphics（圖形）
- 該系列中的Queues支持圖形操作，例如繪制點，線和三角形。

Compute（計算）
- 該系列中的Queues支持諸如computer shader之類的計算操作。

Transfer（傳輸，拷貝）
- 該系列中的Queues支持傳輸操作，例如復制緩沖區和圖像內容。

Sparse binding（稀疏綁定）
- 該系列中的隊列支持用于更新稀疏資源（sparse resource）的內存綁定操作。

image-20200730112126405.png

2.2 Command Buffer

2.2.1 單線程的性能瓶頸

傳統CG API是單線程的，性能的提升只能依賴于CPU主頻的提高。能有的優化方案也不外乎主線程和渲染線程分開，或者某些資源的異步加載、離線處理。

image-20200730114946379.png

但是在實際應用中我們還是經常遇到傳統CG API導致的性能瓶頸。

以手機終端為例，CPU主頻提升有限，各大芯片廠商開始向多核多線程發展，考慮到功耗溫控問題，又不能把CPU頻率升的太高，越來越高的刷新率對實時渲染的速度要求越來越苛刻。

image-20200730115516772.png

Vulkan為了充分發揮CPU多核多線程的作用，引入了command buffer的概念。多個線程可以同時協作，每個CPU線程都可以往自己的command buffer中提交渲染命令，然后統一提交到對應的Queue中，大大提高了CPU的利用率。

image-20200730115609709.png

2.2.2 Command Buffer的作用

應用在繪制時會提交一系列繪制命令給GPU驅動，但是這些繪制命令不會立刻被執行，而是被簡單的添加到Command Buffer的末尾。

在其他CG APIs中，驅動程序在應用不感知的情況下，把API調用翻譯成GPU command并儲存在command buffer中，最終提交給GPU處理。command buffer的創建和銷毀都由驅動負責。

在Vulkan中，你需要自己從Command Buffer Pool中申請command buffer，將想要記錄的命令放入command buffer中。

Command Buffer Pool：

image-20200730142932026.png

2.2.3 Recording command

Command Buffer可以記錄（Record）很多命令，比如：設置狀態、繪制操作、數據拷貝...

image-20200730142958943.png

image-20200730142302468.png

理論上，一個線程可以把Command記錄到多個Command Buffer中，多個線程也可以共享同一個Command Buffer，但是一般不鼓勵多個線程共享一個Command Buffer。

Vulkan的關鍵設計原則之一就是做到高效的多線程。想實現這一點，應用程序要注意因為資源競爭導致的多線程彼此阻塞。因此，每個線程最好有一個或者對個Command Buffer，不要嘗試共享一個。另外，Command Buffer由Command Buffer Pool分配，應用可以為每一個線程創建一個Command Buffer Pool，讓各個工作線程從Command Buffer Pool中分配Command Buffer，無需參與競爭。