行緩存(line buffer)在圖像卷積中的工作方式

行緩存(line buffer)在圖像卷積中的工作方式
上面這張圖配合文字,展示了行緩存(line buffer)在圖像卷積中的工作方式

  • 上半部分是一個按行掃描輸入的圖像塊(示例為 9×9,編號 1–81)。
    藍色表示已被寫入行緩存并按隊列等待的數據,綠色是當前這一步卷積所需的 3×3 鄰域像素。此刻選中的 3×3 為像素 {2,3,4 / 11,12,13 / 20,21,22}。

  • 下半部分畫的是行緩存結構:三條“行 FIFO”(對應 3×3 卷積核的三行)。AXI4-Stream 按順序把新像素從右側送入(虛線箭頭,正在進入的是 23、24、25),緩存里的數據整體向左“移位”。
    當某個像素被移到最左上角位置時,它已經“過窗”,會從緩存中丟棄(刪除)。

  • 對應當前位置,行緩存能同時讀出 9 個像素(綠色塊),與 3×3 卷積核的 9 個系數并行相乘,再經過加法樹求和,得到新的輸出像素(圖中標成 N2)。只要行緩存支持9路并發讀(通過多端口/分區/多BRAM實現),9 次乘法就能完全并行。

  • 當需要并行進行多路卷積(例如多個卷積核/輸出通道)時,行緩存的容量與分區必須相應調整或復制,以提供足夠的并發訪問端口,避免端口沖突。

一句話:圖示的是一個隨輸入像素流滾動的三行緩存,它不斷滑動3×3窗口,支持九值并行乘加,從而高效地產生連續的卷積輸出。

像素 {2,3,4 / 11,12,13 / 20,21,22}被選中的原因:
行緩存在做的是“滑動 3×3 窗口”。

  • 像素按行順序 1、2、3、… 進入緩存,3×3 卷積需要同時讀出 三行 × 三列 的 9 個像素。
  • 這時緩存中三行的數據分別是(從左往右):
    第1行:2…10;第2行:11…19;第3行:20…25(新像素從右側持續進入,整行一起向左移)。三行在列方向上是對齊的。
  • 硬件把每行最左邊的三個位置作為當前卷積窗口的三列,于是得到:
    上:2、3、4;中:11、12、13;下:20、21、22 —— 這就是圖中標綠的 3×3。
  • 這個 3×3 的中心是 12,對應輸出像素 N2(第一行的第 2 個輸出)。
    之后每到一個新像素(例如 26),窗口整體右移一列,讀到的 3×3 會變成 {3,4,5 / 12,13,14 / 21,22,23},輸出 N3,以此類推。

所以,從 2–25 中選出的就是在當前時刻位于三行“頭部”的 3×3 對齊像素

Reference:
F. K?stner, B. Jan?en, F. Kautz, M. Hübner and G. Corradi, “Hardware/Software Codesign for Convolutional Neural Networks Exploiting Dynamic Partial Reconfiguration on PYNQ,” 2018 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW), Vancouver, BC, Canada, 2018, pp. 154-161, doi: 10.1109/IPDPSW.2018.00031.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/94293.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/94293.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/94293.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【數據分享】中國371個城市的坡度矢量數據和excel數據

今天要說明數據就是中國371個城市的坡度矢量數據和excel數據。數據介紹在城市發展的進程中,地形地貌始終是影響規劃決策的關鍵因素,而坡度作為表征地表傾斜程度的核心指標,更是貫穿于城市建設、生態保護等諸多環節。本文將全面解讀中國 371 個…

《WINDOWS 環境下32位匯編語言程序設計》第7章 圖形操作(1)

圖形設備接口GDI(Graphics Device Interface)是Win32的一個重要組成部分,其作用是允許Windows的應用程序將圖形輸出到計算機屏幕、打印機或其他輸出設備上。GDI實際上是一個函數庫,包括直線、畫圖和字體處理等數百個函數。7.1 GDI…

數據結構-HashMap

在 Java 鍵值對(Key-Value)集合中,HashMap 是使用頻率最高的實現類之一,憑借高效的查找、插入性能,成為日常開發的 “利器”。本文將從 HashMap 的底層原理、核心特點、常用方法到遍歷方式、使用注意事項,進…

[系統架構設計師]安全架構設計理論與實踐(十八)

[系統架構設計師]安全架構設計理論與實踐(十八) 一.信息安全面臨的威脅 1.信息系統安全威脅的來源 物理環境,通信鏈路,網絡系統,操作系統,應用系統,管理系統 2.網絡與信息安全風險類別 風險類別…

AI適老服務暖人心:AI適老機頂盒破數字鴻溝、毫米波雷達護獨居安全,銀發生活新保障

銀發經濟領域長期受限于 “專業照護資源稀缺”“老年人數字適應能力弱”“獨居老人安全隱患多” 的困境,而 AI 技術的適老化改造,正讓銀發服務從 “被動保障” 轉向 “主動關懷”,既能幫老年人跨越數字鴻溝,又能為獨居老人筑起安全…

Linux應用軟件編程---網絡編程1(目的、網絡協議、網絡配置、UDP編程流程)

Linux下的網絡編程一、目的不同主機,進程間通信。二、解決的問題1. 主機與主機之間物理層面必須互聯互通。 2. 進程與進程在軟件層面必須互聯互通。物理層面的互聯互通流程圖如下:其中:IP地址:計算機的軟件地址,用來標…

常見開源協議詳解:哪些行為被允許?哪些被限制?

常見開源協議詳解:哪些行為被允許?哪些被限制? 開源世界的魅力在于共享與合作,但不同的開源協議對分發、修改、再發布以及宣傳/推廣有不同的要求和限制。很多開發者在 fork 項目、改 README、放到自己倉庫并在自媒體傳播 時&…

服務器硬盤進行分區和掛載

查看服務器上的硬盤:lsblk -d -o NAME,SIZE,MODEL可以看到我的硬盤是除了vda系統盤以外,還有個vdb。我們查看一下分區:lsblk可以看到:vdb 1T disk (底下沒有分區,也沒有掛載)我們想要用起來這…

【C初階】數據在內存中的存儲

目錄 1. 整數在內存中的存儲 2. 大小端字節序 2.1 什么是大小端? 2.2 為什么有大小端? 2.3 練習 2.3.1 練習1 2.3.2 練習2 2.3.3 練習3 2.3.4 練習4 2.3.5 練習5 2.3.6 練習6 3. 浮點數在內存中的存儲 3.1 浮點數存儲的過程 3.2 浮點數的取…

AI 自動化編程 trae 體驗2 幫我分析一個項目

總結: 接手一個項目可以讓trae 幫忙分析 上次講到trae在處理組件引入的時候,經常會碰到版本問題,分析引入了互聯網上非本版本或者有bug的代碼。主要依賴互聯網的資源庫。 但是分析一個項目應該是沒問題。 這次表現非常好,接手一個…

VMware虛擬機中CentOS 7 報錯 ping: www.xxx.com: Name or service not known

1:主要原因是網絡配置的問題 2:其實就是下面三張圖片中的,物理機虛擬網卡 vmware8 和虛擬機網絡編輯器,如果設置靜態IP 就是這三個地方的問題最簡單的解決辦法第一步:還原虛擬機網絡點擊確認后 ** 第二步給自己的虛擬機設置網絡連接方式 選擇NAT模式連接…

Java面試-自動裝箱與拆箱機制解析

👋 歡迎閱讀《Java面試200問》系列博客! 🚀大家好,我是Jinkxs,一名熱愛Java、深耕技術一線的開發者。在準備和參與了數十場Java面試后,我深知面試不僅是對知識的考察,更是對理解深度與表達能力的…

《VMware 安裝 CentOS 7.9 虛擬機詳細教程(含圖解步驟)》

目錄1.安裝前準備1.1 準備VMware軟件1.1.1 方式一1.1.2 方式二1.2 準備centos7.9鏡像1.2.1 方式一1.2.2 方式二2.安裝centos7.91.安裝前準備 1.1 準備VMware軟件 VMware需要的激活碼百度直接搜索vmware workstation17激活碼就可以搜索到 1.1.1 方式一 這種方式需要注冊官網的…

新能源知識庫(84)什么是IEC白皮書

IEC白皮書是由國際電工委員會(IEC)發布的戰略性技術文件,旨在針對新興技術和社會發展趨勢,提出標準化需求和發展路徑,為全球產業提供前瞻性指導。在新能源領域,IEC白皮書是推動技術創新、產業協同和國際規則…

從零開始學習JavaWeb-15

??一、數據庫安全與防注入實戰??1. ??SQL 注入原理與危害????攻擊本質??:利用輸入漏洞篡改 SQL 語義,例如:SELECT * FROM users WHERE username admin OR 11 -- AND password xxxOR 11導致條件永真,繞過密碼驗證。?…

深入理解深度學習中的“Batch”

文章目錄 **一、什么是Batch?為什么需要它?** **二、Batch Size(批次大小)的影響** **三、Batch, Epoch 和 Iteration 的關系** **四、案例分析** 在深度學習領域,“Batch”(批次)是一個核心且至關重要的概念。它指的是在模型訓練過程中,一次性輸入給神經網絡進行處理的…

27.語言模型

語言模型,是NLP方向一直主力研究的,通過訓練機器,來讓機器學習人類語言的內在規律,理解自然語言,并將其轉換為計算機語言。 目前的主流語言模型,如GPT、Deepseek等,并不是簡單的搜索背誦。他們的…

小智ai+mcp+n8n的智能組合

小智aimcpn8n的智能組合1 小智ai的版本2 n8n的配置3 mcp的demo4 工作流json? 之前有寫過小智ai的介紹,它提供了流暢且豐富的用戶語音交互能力。n8n提供了靈活且穩定的后臺工作流的能力,如果這兩個工具進行組合,可以打造一個好玩又好用的智能…

【DataGrip】連接達夢數據庫后,能查詢數據但是看不到表的幾種情況分析,達夢數據庫驅動包下載DmJdbcDriver18.jar

大概分為以下兩類情況,配置問題和驅動包的問題 DmJdbcDriver18.jar點擊下載 1.配置了表不可見 左上角點擊過濾的圖標,把table勾上就可以 2.Introspect using JDBC metadata 未勾選 1)老版本的DataGrip 在options選項下 3)新版…

全面解析 `strncasecmp` 字符串比較函數

1) 函數的概念與用途 strncasecmp 是 C 語言中一個非常實用的字符串處理函數,它執行不區分大小寫的字符串比較,但只比較前 n 個字符。這個函數的名字來源于"string n case-compare"(字符串前n個字符不區分大小寫比較)。…