unfold 切圖像,圖形transformer的切割操作

import torch
x = torch.arange(8*12).view(1,1,8,12)
m=x.unfold(2, 4, 4)
n = m.unfold(3, 4, 4)

輸入

第一次切,切高度維度,但是切完做了轉置 ,得到(1,1,2,12,4)

切寬度? 得到 張量維度1 1 2 3 4 4? 最后得到 維度表示:批次 通道 高度切塊數 寬度切塊數 高度 寬度

patches.contiguous().view(B, -1, 4*4)其中contiguous()不用管,不改變張量形狀.view(B, -1, 4*4),把張量第一維度是 B,第二維度-1代表自動計算大小,其實就是總共切塊的數目,最后一維度代表一個塊的大小

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/919494.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/919494.shtml
英文地址,請注明出處:http://en.pswp.cn/news/919494.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于最小二乘支持向量機的數據回歸預測 LSSVM

一、作品詳細簡介 1.1附件文件夾程序代碼截圖 全部完整源代碼,請在個人首頁置頂文章查看: 學行庫小秘_CSDN博客?編輯https://blog.csdn.net/weixin_47760707?spm1000.2115.3001.5343 1.2各文件夾說明 1.2.1 main.m主函數文件 該MATLAB 代碼實現了…

Java虛擬機故障處理工具全指南

目錄 一、JVM故障處理工具概述 二、詳細工具解析 1. jps:虛擬機進程狀況工具 2. jstat:虛擬機統計信息監視工具 3. jinfo:Java配置信息工具 4. jmap:Java內存映像工具 5. jhat:堆轉儲快照分析工具 6. jstack&a…

【LeetCode熱題100道筆記+動畫】接雨水

題目描述 給定 n 個非負整數表示每個寬度為 1 的柱子的高度圖,計算按此排列的柱子,下雨之后能接多少雨水。 示例 1: 輸入:height = [0,1,0,2,1,0,1,3,2,1,2,1] 輸出:6 解釋:上面是由數組 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度圖,在這種情況下,可以接 6 個單位的雨水…

短劇小程序系統開發:構建影視娛樂新生態的基石

在移動互聯網的浪潮中,影視娛樂行業正經歷著深刻的變革。短劇,作為一種新興的內容形式,以其獨特的魅力和廣泛的受眾基礎,成為了行業發展的新亮點。而短劇小程序系統開發,則是構建影視娛樂新生態的基石,為行…

基于Pytochvideo訓練自己的的視頻分類模型

視頻分類模型簡介 ?X3D 系列模型 官方網站 https://github.com/facebookresearch/SlowFast ?提出論文? Facebook Research 的《X3D: Expanding Architectures for Efficient Video Recognition》 https://arxiv.org/pdf/2004.04730 原理 X3D 的設計思路受到機器學習中…

LidaRefer-v2論文速讀

研究背景 研究背景 3D視覺定位(3D Visual Grounding, VG)是一項旨在根據自然語言描述,在三維場景中精確定位出相應物體或區域的任務 。這項技術在人機交互領域至關重要,尤其是在自動駕駛、機器人技術和AR/VR等應用中,它…

邏輯移位與算術移位

根本的區別在于:它們如何對待符號位(最高位)。 一、邏輯移位 (Logical Shift) 無論左移、右移,空出的位永遠用 0 填充。主要針對無符號整數、快速乘除2的冪。 二、算術移位 (Arithmetic Shift) 左移用 0 填充、右移用符號位填充。…

內存對齊的使用和禁用

在 C 語言和 C 中,__attribute__((packed)) 是一種用于數據結構體的編譯器擴展屬性,這個屬性主要用于修改結構體的內存對齊行為。背景知識:結構體內存對齊在許多計算機架構中,編譯器會自動對數據進行對齊(alignment&am…

SpringBoot3后端項目介紹:mybig-event

mybig-event 項目簡介 mybig-event 是一個基于 Spring Boot 的事件管理系統,提供用戶管理、文章發布、分類管理、文件上傳等功能,采用現代化的 Java 技術棧構建,支持高效開發和部署。 倉庫鏈接:https://github.com/foorgange/mybi…

week3-[分支嵌套]方陣

week3-[分支嵌套]方陣 題目描述 有 nmn\times mnm 個人站成 nnn 行 mmm 列的方陣。我們想知道第 xxx 行 yyy 列的人的某個方向有沒有人。 輸入格式 輸入共 222 行。 第 111 行輸入 444 個正整數 n,m,x,yn,m,x,yn,m,x,y。 第 222 行輸入 111 個字符為 U、D、L、R 其中之一&#…

深入理解C++ std::shared_ptr:現代C++內存管理的藝術與實踐

在C++的發展歷程中,內存管理始終是開發者面臨的核心挑戰。從C語言繼承而來的手動內存管理方式,雖然提供了極大的靈活性,卻也成為無數程序錯誤的根源。內存泄漏、懸空指針、雙重釋放等問題長期困擾著C++開發者,直到智能指針的出現改變了這一局面。作為C++11標準引入的重要特…

一個 WPF 文檔和工具窗口布局容器

一個 WPF 文檔和工具窗口布局容器、用于排列文檔 和工具窗口的方式與許多知名 IDE 類似,例如 Eclipse、Visual Studio、 PhotoShop 等等 AvalonDock 是一個 WPF 文檔和工具窗口布局容器,用于排列文檔 和工具窗口的方式與許多知名 IDE 類似,例…

【qml-5】qml與c++交互(類型單例)

背景: 【qml-1】qml與c交互第一次嘗試(實例注入) 【qml-2】嘗試一個有模式的qml彈窗 【qml-3】qml與c交互第二次嘗試(類型注冊) 【qml-4】qml與c交互(類型多例) 【qml-5】qml與c交互&#…

循環神經網絡(RNN)、LSTM 與 GRU (一)

循環神經網絡(RNN)、LSTM 與 GRU (一) 文章目錄循環神經網絡(RNN)、LSTM 與 GRU (一)循環神經網絡(RNN)、LSTM 與 GRU一、RNN(Recurrent Neural N…

【AAOS】Android Automotive 16模擬器源碼下載及編譯

源碼下載repo init -u https://android.googlesource.com/platform/manifest -b android-16.0.0_r2 repo sync -c --no-tags --no-clone-bundle源碼編譯source build/envsetup.sh lunch sdk_car_x86_64-bp2a-eng make -j8運行效果emualtorHomeAll appsSettingsHAVCNotification…

jvm三色標記

好的,咱們把專業概念和生活例子結合起來,一步一步說清楚三色標記法:一、核心概念:用“顏色”給對象貼“狀態標簽”就像給家里的物品貼標簽,每種顏色代表它在“垃圾回收(大掃除)”中的狀態&#…

生成式AI的能力邊界與職業重構:從“百科實習生“到人機協作增強器

根據微軟最新研究,基于20萬條Copilot使用數據及用戶反饋,研究者揭示了生成式AI在實際應用中的能力邊界與職業影響。數據顯示,用戶使用AI助手最頻繁的任務是信息獲取(占比近40%),其次是公眾溝通類工作&#…

java17學習筆記

Java17是一個重要的特性發布,也是比較常用的一個版本,根據 2024Java生態統計,Java 17、11 和 8 的用戶比例分別為 35%、33% 和 29%。它遵循了自Java10以來引入的Java發布步調,并于2021年 9 月 14 日發布,在Java16發布后…

【AI應用】修改向量數據庫Milvus默認密碼

說明: 1)部署向量數據庫milvus運行一段時間后,想開啟密碼認證登錄attu頁面 2)開啟密碼認證登錄,提示用戶和密碼不正確,因為默認密碼已存儲在物理機 3)通過attu管理頁面修改向量數據庫milvus默認…

分布式系統消息隊列:可靠投遞與延時消息實戰

在分布式系統架構中,消息隊列(MQ)作為解耦服務、削峰填谷、異步通信的核心組件,其消息投遞的可靠性與延時消息的精準性直接影響業務系統的穩定性。本文結合實際業務場景,詳細解析消息投遞的全流程設計與延時消息的通用…