雙流網絡論文精讀筆記

雙流網絡論文精讀筆記

news/2025/9/17 5:32:22/文章來源:https://blog.csdn.net/m0_54625820/article/details/134545839

精讀視頻：雙流網絡論文逐段精讀【論文精讀】_嗶哩嗶哩_bilibili

Two-Stream Convolutional Networks for Action Recognition in Videos

傳統的神經網絡難以學習到物體的運動信息，雙流網絡則通過光流將物體運動信息抽取出來再傳遞給神經網絡給模型提供先驗信息，再讓網絡學習動作和輸出的映射關系

其他論文：deep video

Spatial stream ConvNet：空間流神經網絡，關注 appearance 信息，輸入是單幀圖片輸出分類概率，從靜止圖像中做動作識別是圖像分類任務，可以預訓練
Temporal stream ConvNet：時間流神經網絡，關注 motion information，輸入一系列光流(optical flow)圖片輸出也是分類概率
兩者分類概率取加權平均得到最終預測

光流網絡

光流

每兩張圖片得到一張光流四張連續幀得到三個光流，分為水平運動和垂直運動的兩維光流，每個像素點都有對應光流值

兩種疊加光流圖片輸入到神經網絡的方法

方法一：左邊的圖，直接堆疊，在每張圖同樣位置的像素點處詢問該點的運動軌跡

方法二：根據像素點的軌跡，下一幀運動到另一點再從那一點繼續

Bi-directional optical flow 雙向光流

上述兩種方法都是前向的光流計算，而光流反過來計算也是可以的

作者把一個視頻的前半段用于計算前向光流，后半段計算反向光流

光流網絡的輸入

空間流網絡：輸入 channel = 3，RGB三通道

時間流網絡：L+1 張連續單幀圖像得到 L 張光流圖，輸入的 channel 數是 2L，光流圖的疊加是先疊加水平、后疊加豎直方向的光流位移

實現細節

測試部分

不論視頻多長，等間隔抽取 25 幀
空間流：對每一幀，取四角和中心得到5張圖，將該幀翻轉過來后同樣操作，共計得到10張；25幀則共250張圖，都經過空間流神經網絡得到結果
時間流：對每一幀都往后取11幀圖抽取得到10張光流圖

如何預處理和計算光流

每一幀、每個像素點都有光流值，處理需要的時間空間都太大，所以進行壓縮：把光流值壓縮到0~255且變成整數，并把光流存成JPEG圖片形式光流圖變小了

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/160520.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/160520.shtml
英文地址，請注明出處：http://en.pswp.cn/news/160520.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Golang 中的良好代碼與糟糕代碼

Golang 中的良好代碼與糟糕代碼

最近，有人要求我詳細解釋在 Golang 中什么是好的代碼和壞的代碼。我覺得這個練習非常有趣。實際上，足夠有趣以至于我寫了一篇關于這個話題的文章。為了說明我的回答，我選擇了我在空中交通管理（ATM）領域遇到的一個具體用…

閱讀更多...

linux部署jar 常見問題

linux部署jar 常見問題

1.java -jar xxx.jar no main manifest attribute, in xxx.jar 一.no main manifest attribute, in xxx.jar 在pom.xml文件中加入： <plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifac…

閱讀更多...

C語言每日一題（35）有效的括號

C語言每日一題（35）有效的括號

力扣網 20 有效的括號題目描述給定一個只包括 (，)，{，}，[，] 的字符串 s ，判斷字符串是否有效。有效字符串需滿足： 左括號必須用相同類型的右括號閉合。左括號必須以正確的順序閉合。每個右…

閱讀更多...

CountDownLatch和CyclicBarrier

CountDownLatch和CyclicBarrier

JUC（Java.util.concurrent）是Java 5中引入的一個并發編程庫，它包含了許多用于多線程處理的工具類和接口。JUC主要提供了以下特性： 線程池：線程池可以提高線程的使用效率，避免頻繁地創建和銷毀線程&#xff…

閱讀更多...

Kotlin學習——hello kotlin 函數function 變量類 + 泛型 + 繼承

Kotlin學習——hello kotlin 函數function 變量類 + 泛型 + 繼承

Kotlin 是一門現代但已成熟的編程語言，旨在讓開發人員更幸福快樂。它簡潔、安全、可與 Java 及其他語言互操作，并提供了多種方式在多個平臺間復用代碼，以實現高效編程。 https://play.kotlinlang.org/byExample/01_introduction/02_Functio…

閱讀更多...

Docker Swarm總結（2/3）

Docker Swarm總結（2/3）

目錄 8、service 操作 8.1 task 伸縮 8.2 task 容錯 8.3 服務刪除 8.4 滾動更新 8.5 更新回滾 9、service 全局部署模式 9.1 環境變更 9.2 創建 service 9.3 task 伸縮 10、overlay 網絡 10.1 測試環境 1搭建 10.2 overlay 網絡概述 10.3 docker_gwbridg 網絡基礎…

閱讀更多...

【DevOps】Git 圖文詳解（八）：后悔藥 - 撤銷變更

【DevOps】Git 圖文詳解（八）：后悔藥 - 撤銷變更

Git 圖文詳解（八）：后悔藥 - 撤銷變更 1.后悔指令 🔥2.回退版本 reset3.撤銷提交 revert4.checkout / reset / revert 總結發現寫錯了要回退怎么辦？看看下面幾種后悔指令吧！ ? 還沒提交的怎么撤銷&#x…

閱讀更多...

Visual Studio連接unity編輯器_unity基礎開發教程

Visual Studio連接unity編輯器_unity基礎開發教程

Visual Studio連接unity編輯器問題描述解決方法意外情況問題描述當我們在unity編輯器中打開C#腳本的時候發現Visual Studio沒有連接unity編輯器，在編寫代碼的時候也沒有unity關鍵字的提醒。簡單來說就是敲代碼沒有代碼提示。解決方法這時候需要在unity中進行…

閱讀更多...

Qt實現圖片旋轉的幾種方式（全）

Qt實現圖片旋轉的幾種方式（全）

目錄一、用手搓（QPainter） 二、使用 QGraphicsView 和 QGraphicsPixmapItem 三、使用 QTransform 實現圖像旋轉四、利用 OpenGL 實現旋轉圖像的效果有幾種不同的方法，其中常見的包括： 手動旋轉繪制： 使用 QPaint…

閱讀更多...

網絡吞吐量公網帶寬有關嗎？

網絡吞吐量公網帶寬有關嗎？

環境： 華為交換機深信服防火墻問題描述： 網絡吞吐量公網帶寬有關嗎？ 解決方案： 網絡吞吐量網絡吞吐量是指在特定時間內通過網絡傳輸的數據量。它衡量了網絡設備（如防火墻、交換機、路由器）或網絡連…

閱讀更多...

終端仿真軟件 SecureCRT v9.4.2

終端仿真軟件 SecureCRT v9.4.2

SecureCRT是一款終端仿真軟件，它提供了類似于Telnet和SSH等協議的遠程訪問功能。SecureCRT專門為網絡管理員、系統管理員和其他需要保密訪問網絡設備的用戶設計。 SecureCRT具有以下特點： 安全性：SecureCRT支持SSH1、SSH2、SSL和TLS等加密和…

閱讀更多...

素短語的定義

素短語的定義

素短語，是指至少含有一個終結符的短語，并且除自身外，不包含更小的素短語。最左素短語是句型中最左邊的素短語。

閱讀更多...

7.HTML中列表標簽

7.HTML中列表標簽

7.列表標簽 7.1無序列表（重點） 表格是用來顯示數據的，那么列表就是用來布局的。列表最大的特點就是整齊，整潔，有序，他作為布局會更加自由和方便， 根據使用的情景不同，列表可分為三…

閱讀更多...

數字圖像處理(岡薩雷斯)學習筆記

數字圖像處理(岡薩雷斯)學習筆記

目錄一.機器視覺和計算機視覺二.圖像處理基礎1.什么是圖像2.如何訪問圖像三.圖像仿射變換四.灰度變換一.機器視覺和計算機視覺機器視覺(Machine Vision,MV)和計算機視覺(Computer Vision，CV)的區別和聯系： 機器視覺更注重廣義圖像信號(激光&#xff…

閱讀更多...

C#中的Fody

C#中的Fody

在C#中，NuGet里的Fody是一個用于.NET應用程序的代碼增強工具。它通過在編譯過程中自動織入代碼，改變目標程序集的行為。Fody的一個常見用途是簡化屬性通知的實現，特別適用于WPF綁定。在WPF中，屬性通知是一種機制，用于…

閱讀更多...

C語言操作符例題

C語言操作符例題

這里寫目錄標題例題一題目解析例題二題目解析例題三方法一方法二方法三例題四例題五感謝各位大佬對我的支持,如果我的文章對你有用,歡迎點擊以下鏈接 🐒🐒🐒 個人主頁 🥸🥸🥸 C語言 🐿?…

閱讀更多...

智能指針（Newbie Note）

智能指針（Newbie Note）

智能指針專題 1.普通指針的問題2.智能指針是什么什么是所有權 3.智能指針三個好處：4.C11提供的智能指針4.1 shared_ptr（共享所有權指針）4.1.1 分配內存4.1.2 成員函數4.1.3 計數情況匯總：4.1.4 示例代碼(計數)4.1.5 示例代碼(rese…

閱讀更多...

Java深拷貝與淺拷貝技術解析及實例演示

Java深拷貝與淺拷貝技術解析及實例演示

摘要：本文將詳細介紹Java中的深拷貝和淺拷貝概念，通過分析源碼和舉例說明，幫助讀者更好地理解這兩種拷貝方式的區別及應用場景。一、深拷貝與淺拷貝的概念深拷貝：復制一個對象后，無論是基本數據類型還是引用類型&…

閱讀更多...

多柱漢諾塔問題

多柱漢諾塔問題

k柱漢諾塔題目描述漢諾塔（Hanoi Tower），又稱河內塔。傳說大梵天創造世界的時候做了三根金剛石柱子，按左、中、右排序。大梵天在左側的柱子上，從下往上按照大小順序摞著64片黃金圓盤，越靠下的圓盤越大。…

閱讀更多...

個人博客項目 - 測試報告

個人博客項目 - 測試報告

文章目錄一、項目背景二、測試報告功能測試1.編寫測試用例2.登錄測試3.編寫文章測試4.查看文章測試5.刪除文章測試7.注銷登錄測試自動化測試性能測試1.VUG2.進行場景設計3.生成性能測試報告總結本文開始一、項目背景通過學習測試相關的知識，動手實踐并測試一…

閱讀更多...

最新文章