DCTNet

DCTNet

http://giantpandacv.com/academic/%E7%AE%97%E6%B3%95%E7%A7%91%E6%99%AE/%E9%A2%91%E5%9F%9F%E4%B8%AD%E7%9A%84CNN/CVPR%202020%20%E5%9C%A8%E9%A2%91%E5%9F%9F%E4%B8%AD%E5%AD%A6%E4%B9%A0%E7%9A%84DCTNet/
一個對輸入圖像進行頻域轉換和選擇的方法,達到壓縮的目的,主要應用大分辨率圖像壓縮為小的輸入圖像,輸入到神經網絡。

1.首先對圖像進行正常的預處理: resize, croping, flip等.

2.然后轉換到YCbCr空間:

參考:https://zhuanlan.zhihu.com/p/88933905
0.564應該是0.504
在這里插入圖片描述

3.dct轉換

https://blog.csdn.net/tywwwww/article/details/126464132
分別對 Y, Cb, Cr處理
假如 224 224 1 的圖像,進行patchsize= 8的DCT變換后
得到(56x8) (56x8) 1的圖像

然后 每個8x8 patch相同的頻率的 group在一起,什么意思呢?就是pixelshuffle的逆操作,這樣 變為 56x56x64的 大小, YCbCr一共 192個channel
注意此時每個通道的含義:每個通道表示相同的頻率。
如下圖所示:只是下圖的patch size=2
在這里插入圖片描述

4.dct channel prune:Learning-based Frequency Channel Selection

雖然以上 圖像h,w降下來了,但是channel 變大,整體數據量是沒有變的。這個時候可以應用通道剪枝的方法,對channel進行篩選。
在這里插入圖片描述

論文中先 vagpool , 再 1x1卷積 得到tensor3。 剩下的不懂也感覺麻煩。tensor3后面跟softmax 不是就可以 select了嗎 轉化為 0,1

具體選擇了哪些頻率,作者畫出來了:

8x8 patch 共有64個頻率,下圖的數字就是表示各個頻率。 顏色深淺表示保留的概率。
可以看出低頻更容易被保留。因此作者還實驗了 固定保留左上角的頻率,左上角的方塊Square或者三角Triangle。 和動態選擇 的性能差不多。因此是不是就沒必要動態select channel了
在這里插入圖片描述

在這里插入圖片描述

在 high level任務上這樣做或許可以,但是low level任務高頻信息一般也比較重要。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/719182.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/719182.shtml
英文地址,請注明出處:http://en.pswp.cn/news/719182.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python實現手機號歸屬地查詢

手機上突然收到了某銀行的短信提示,看了一下手機的位數,正好是11位。我一想,這不就是標準的手機號碼嗎?于是一個想法涌上心頭——用python的庫實現查詢手機號碼歸屬地查詢自由。 那實現的效果如下: 注:電…

達夢數據庫基礎操作(一):用戶操作

達夢數據庫基礎操作(一):用戶操作 1 達夢運行狀態 SELECT banner as 版本信息 FROM v$version;1.2 達夢版本號 SELECT banner as 版本信息 FROM v$version;1.3 用戶相關操作 默認用戶名密碼:SYSDBA/SYSDBA 注意:在哪個數據庫下創建的用戶…

2.3_3 進程互斥的硬件實現方法

文章目錄 2.3_3 進程互斥的硬件實現方法(一)中斷屏蔽方法(二)TestAndSet指令(三)Swap指令 總結(四)互斥鎖 2.3_3 進程互斥的硬件實現方法 學習提示: 1.理解各方法的原理 …

寶塔Linux面板遷移網站數據的詳細步驟是什么?

寶塔Linux面板遷移網站數據的詳細步驟是什么? 準備工作:確保寶塔面板處于最新版本并與服務器環境一致。如果需要遷移到其他機器,需要將遷入服務器的寶塔面板信息和API秘鑰填寫好。秘鑰的有效期為7天,建議在使用后手動關閉接口以保…

Python從0到100(二):Python語言介紹及第一個Pyhon程序

前言: 零基礎學Python:Python從0到100最新最全教程。 想做這件事情很久了,這次我更新了自己所寫過的所有博客,匯集成了Python從0到100,共一百節課,幫助大家一個月時間里從零基礎到學習Python基礎語法、Pyth…

springcloud:3.3測試重試機制

服務提供者【test-provider8001】 Openfeign遠程調用服務提供者搭建 文章地址http://t.csdnimg.cn/06iz8 相關接口 測試遠程調用:http://localhost:8001/payment/index 服務消費者【test-consumer-resilience4j8004】 Openfeign遠程調用消費者搭建 文章地址http:/…

Vue 3 中如何使用全局 API?

Vue 3 中的全局 API 使用詳解 Vue 3 相較于 Vue 2 在全局 API 的使用上有了較大的變化。Vue 3 引入了新的全局 API 創建方式,并通過 createApp 方法替代了 Vue 2 中的 new Vue()。這種變化使得 Vue 3 在全局 API 的使用上更加靈活,也更好地支持了 tree-…

UNIapp實現局域網內在線升級

首先是UNIapp 生成apk 用Hbuilder 進行打包 可以從網站https://www.yunedit.com/reg?gotocert 使用自有證書,目測比直接使用云證書要快一些。 發布apk 網站 用IIS發布即可 注意事項中記錄如下內容 第一、需要在 iis 的MiMe 中添加apk 的格式,否則無法…

如何本地創建websocket服務端并發布到公網實現遠程訪問

文章目錄 1. Java 服務端demo環境2. 在pom文件引入第三包封裝的netty框架maven坐標3. 創建服務端,以接口模式調用,方便外部調用4. 啟動服務,出現以下信息表示啟動成功,暴露端口默認99995. 創建隧道映射內網端口6. 查看狀態->在線隧道,復制所創建隧道的公網地址加端口號7. 以…

如何實現飛書與金蝶無縫對接,提升業務效率與客戶滿意度?

一、客戶介紹 某貿易有限公司是一家專業從事進口葡萄酒和高端烈酒銷售的企業。在市場競爭日益激烈的今天,該公司始終堅持以客戶為中心,以市場為導向,不斷創新和進步。公司不僅注重傳統銷售渠道的拓展,還積極擁抱互聯網&#xff0…

processing繪制笑臉

笑臉效果圖: processing代碼: void setup(){size(1000,1000);//Canvas sizebackground(#ffcc33);//Canvas background color } void draw(){ strokeWeight(12);//face-width12px fill(#ffffcc);//face arc(500,500,200,200,0,TWO_PI);//face-size strok…

Python中的自然語言處理和文本挖掘

在Python中,自然語言處理(NLP)和文本挖掘通常涉及對文本數據進行清洗、轉換、分析和提取有用信息的過程。Python有許多庫和工具可以幫助我們完成這些任務,其中最常用的包括nltk(自然語言處理工具包)、spaCy…

統計C語言代碼行數的pyton代碼

首先是白嫖以下大神的代碼:統計python代碼行數小工具_linecount工具-CSDN博客 然后,讓ChatGPT幫我改為如下的完整代碼: import os from tkinter import Tk, Label, Button, filedialog def open_file(file_path, encoding): try: file op…

【推薦算法系列十八】:DSSM 召回算法

參考 推薦系統中 DSSM 雙塔模型匯總(二更) DSSM 和 YouTubeDNN 都是比較經典的 U2I 模型。 U2I 召回 U2I 召回也就是 User-to-Item 召回,它基于用戶的歷史行為以及用戶的一些個人信息,對系統中的候選物品進行篩選,挑…

備考2024年上海高考數學:歷年選擇題真題練一練(2014~2023)

今天距離2024年高考還有三個多月的時間,今天我們來看一下2014~2023年的上海高考數學的選擇題,從過去十年的真題中隨機抽取5道題,并且提供解析。 后附六分成長獨家制作的在線練習集,科學、高效地反復刷這些真題,吃透真題…

Dockerfile執行的時候沒有執行CMD

參考:https://blog.csdn.net/Zx13170918986/article/details/130831052 在dockerfile中編寫CMD后,發現如果執行docker run -itd這樣的指令,是沒法啟動CMD腳本的,例如以下的dockerfile FROM node:16 WORKDIR /home/ COPY start_…

Sora爆火,數字人IP如何借助AIGC視頻生成軟件制作短視頻營銷?

ChatGPT、Sora等大模型的出現,創新了短視頻內容創作生產方式。但目前Sora模型無法準確模擬復雜場景的物理特性,并且可能無法理解因果關系導致視頻失真。 廣州虛擬動力基于用戶使用需求,推出了AIGC數字人視頻生成平臺,企業、品牌可…

c++基礎學習第三天(指針,結構體)

c基礎學習第三天(指針,結構體) 文章目錄 1、指針1.1、指針的基本概念1.2、指針變量的定義和使用1.3、 指針所占內存空間1.4、空指針和野指針1.5、 const修飾指針1.5.1、const修飾指針-常量指針1.5.2、const修飾常量-指針常量1.5.3、const即修…

Android MediaCodec 簡明教程(五):使用 MediaCodec 編碼 ByteBuffer 數據,并保存為 MP4 文件

系列文章目錄 Android MediaCodec 簡明教程(一):使用 MediaCodecList 查詢 Codec 信息,并創建 MediaCodec 編解碼器Android MediaCodec 簡明教程(二):使用 MediaCodecInfo.CodecCapabilities 查…

php:實現字符串補零str_pad()

說明 str_pad($input_string, $total_length, $pad_string, $pad_type); $input_string 是要填充的原始字符串。$total_length 是填充后的字符串總長度,包括原始字符串的長度。$pad_string 是用于填充的字符,通常是零。$pad_type 是填充的位置&#xff0…