Pytorch源碼搜索與分析

PyTorch的的代碼主要由C10、ATen、torch三大部分組成的。其中:

C10

C10,來自于Caffe Tensor Library的縮寫。這里存放的都是最基礎的Tensor庫的代碼,可以運行在服務端和移動端。PyTorch目前正在將代碼從ATen/core目錄下遷移到C10中。C10的代碼有一些特殊性,體現在這里的代碼除了服務端外還要運行在移動端,因此編譯后的二進制文件大小也很關鍵,因此C10目前存放的都是最核心、精簡的、基礎的Tensor函數和接口。

C10目前最具代表性的一個class就是TensorImpl了,它實現了Tensor的最基礎框架。繼承者和使用者有:

Variable的Variable::Impl
SparseTensorImpl
detail::make_tensor(storage_impl, CUDATensorId(), false)
Tensor(c10::intrusive_ptr<TensorImpl, UndefinedTensorImpl> tensor_impl)
c10::make_intrusive<at::TensorImpl, at::UndefinedTensorImpl>
值得一提的是,C10中還使用/修改了來自llvm的SmallVector,在vector元素比較少的時候用以代替std::vector,用以提升性能;

ATen

ATen,來自于 A TENsor library for C++11的縮寫;PyTorch的C++ tensor library。ATen部分有大量的代碼是來聲明和定義Tensor運算相關的邏輯的,除此之外,PyTorch還使用了aten/src/ATen/gen.py來動態生成一些ATen相關的代碼。ATen基于C10,Gemfield本文討論的正是這部分;

torch._VF

torch._VF is a subset of those functions are mapped to ATen functions in torch/jit/_builtins.py.
例如如果沿著torch.nn.dropout去找,會發現找到torch._VF這個庫,IDE無法繼續navigate:
在這里插入圖片描述
這時候直接去github的pytorch源碼repo(https://github.com/pytorch/pytorch/tree/b3bb234e16780ea3f3d749d2c8c156c9245eb797)搜dropout_就能很快看到在cpu上cpp的實現:
在這里插入圖片描述
加上cuda的限制就是gpu的實現:
在這里插入圖片描述
另外在pytorch的老舊版本,像dropout這種由python實現的算子在pytorch v1.0.4版本的https://github.com/pytorch/pytorch/blob/v0.1.4/torch/nn/functions/dropout.py 這個目錄下還能找到,但是github并沒有提供歷史tag的搜索功能,不如就去https://github.com/colesbury/pytorch-old/tree/master/torch/nn/functions 這個古早目錄下面找吧

Torch

Torch,部分代碼仍然在使用以前的快要進入歷史博物館的Torch開源項目,比如具有下面這些文件名格式的文件:

TH* = TorcH
THC* = TorcH Cuda
THCS* = TorcH Cuda Sparse (now defunct)
THCUNN* = TorcH CUda Neural Network (see cunn)
THD* = TorcH Distributed
THNN* = TorcH Neural Network
THS* = TorcH Sparse (now defunct)
THP* = TorcH Python
PyTorch會使用tools/setup_helpers/generate_code.py來動態生成Torch層面相關的一些代碼,這部分動態生成的邏輯將不在本文闡述,你可以關注Gemfield專欄的后續文章。

部分轉載自

  1. https://zhuanlan.zhihu.com/p/55966063

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/37598.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/37598.shtml
英文地址,請注明出處:http://en.pswp.cn/news/37598.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

12-數據結構-數組、矩陣、廣義表

數組、矩陣、廣義表 目錄 數組、矩陣、廣義表 一、數組 二.矩陣 三、廣義表 一、數組 這一章節理解基本概念即可。數組要看清其實下標是多少&#xff0c;并且二維數組&#xff0c;存取數據&#xff0c;要先看清楚是按照行存還是按列存&#xff0c;按行則是正常一行一行的去讀…

學習Vue:slot使用

在Vue.js中&#xff0c;組件高級特性之一是插槽&#xff08;Slots&#xff09;。插槽允許您在父組件中插入內容到子組件的特定位置&#xff0c;從而實現更靈活的組件復用和布局控制。本文將詳細介紹插槽的使用方法和優勢。 什么是插槽&#xff1f; 插槽是一種讓父組件可以向子…

AIF360入門教學

1、AIF360簡介 AI Fairness 360 工具包(AIF360)是一個開源軟件工具包&#xff0c;可以幫助檢測和緩解整個AI應用程序生命周期中機器學習模型中的偏見。在整個機器學習的過程中&#xff0c;偏見可能存在于初始訓練數據、創建分類器的算法或分類器所做的預測中。AI Fairness 360…

OPENCV C++(十一)

鼠標響應函數 //鼠標響應函數 void on_mouse(int EVENT, int x, int y, int flags, void* userdata) {Mat hh;hh *(Mat*)userdata;switch (EVENT){case EVENT_LBUTTONDOWN:{vP.x x;vP.y y;drawMarker(hh, vP, Scalar(255, 255, 255));//circle(hh, vP, 4, cvScalar(255, 255…

人工智能在監控系統中的預測與優化:提升效率和響應能力

引言&#xff1a;人工智能的發展給監控系統帶來了新的可能性&#xff0c;通過分析歷史監控數據和其他相關數據&#xff0c;人工智能可以預測未來可能發生的事件&#xff0c;如交通擁堵、安全隱患等&#xff0c;并幫助優化監控系統的配置和資源分配。這種預測和優化的能力可以提…

2023年國賽數學建模思路 - 復盤:校園消費行為分析

文章目錄 0 賽題思路1 賽題背景2 分析目標3 數據說明4 數據預處理5 數據分析5.1 食堂就餐行為分析5.2 學生消費行為分析 建模資料 0 賽題思路 &#xff08;賽題出來以后第一時間在CSDN分享&#xff09; https://blog.csdn.net/dc_sinor?typeblog 1 賽題背景 校園一卡通是集…

vue3表格,編輯案例

index.vue <script setup> import { onMounted, ref } from "vue"; import Edit from "./components/Edit.vue"; import axios from "axios";// TODO: 列表渲染 const list ref([]); const getList async () > {const res await ax…

6.2.0在線編輯:GrapeCity Documents for Word (GcWord) Crack

GrapeCity Word 文檔 (GcWord) 支持 Office Math 函數以及轉換為 MathML GcWord 現在支持在 Word 文檔中創建和編輯 Office Math 內容。GcWord 中的 OMath 支持包括完整的 API&#xff0c;可處理科學、數學和通用 Word 文檔中廣泛使用的數學符號、公式和方程。以下是通過 OMa…

無法在 macOS Ventura 上啟動 Multipass

異常信息 ? ~ sudo multipass authenticate Please enter passphrase: authenticate failed: Passphrase is not set. Please multipass set local.passphrase with a trusted client. ? ~ multipass set local.passphrase Please enter passphrase: Please re-enter…

大語言模型LLM的一些點

LLM發展史 GPT模型是一種自然語言處理模型,使用Transformer來預測下一個單詞的概率分布,通過訓練在大型文本語料庫上學習到的語言模式來生成自然語言文本。 GPT-1(117億參數),GPT-1有一定的泛化能力。能夠用于和監督任務無關的任務中。GPT-2(15億參數),在生成方面表現出很…

vue自定義指令--動態參數綁定

在企業微信側邊欄應用中&#xff0c;給dialog添加了拖拽功能&#xff0c;但是因為dialog高度超過了頁面高度&#xff0c;所以高度100%時拖拽有個bug--自動貼到窗口頂部而且企業側邊欄寬高都有限制&#xff0c;拖拽效果并不理想&#xff0c;所以就想縮小dialog再進行拖拽。 拖拽…

IntelliJ IDEA和Android studio怎么去掉usage和作者提示

截止到目前我已經寫了 600多道算法題&#xff0c;其中部分已經整理成了pdf文檔&#xff0c;目前總共有1000多頁&#xff08;并且還會不斷的增加&#xff09;&#xff0c;大家可以免費下載 下載鏈接&#xff1a;https://pan.baidu.com/s/1hjwK0ZeRxYGB8lIkbKuQgQ 提取碼&#xf…

java處理CSV文件

文章目錄 1. 方法2. maven依賴3. 示例代碼 1. 方法 opencsv–>CSVParser&#xff1b;commons-csv–>CSVReader&#xff1b;有時候文本里有逗號可能會導致錯誤分割 2. maven依賴 <dependency><groupId>org.apache.commons</groupId><artifactId>…

457. 環形數組是否存在循環

457. 環形數組是否存在循環 原題鏈接&#xff1a;完成情況&#xff1a;解題思路&#xff1a;參考代碼&#xff1a;經驗吸取 原題鏈接&#xff1a; 457. 環形數組是否存在循環 https://leetcode.cn/problems/circular-array-loop/description/ 完成情況&#xff1a; 解題思路…

使用Pandas進行數據清理的入門示例

數據清理是數據分析過程中的關鍵步驟&#xff0c;它涉及識別缺失值、重復行、異常值和不正確的數據類型。獲得干凈可靠的數據對于準確的分析和建模非常重要。 本文將介紹以下6個經常使用的數據清理操作&#xff1a; 檢查缺失值、檢查重復行、處理離群值、檢查所有列的數據類型…

explicit關鍵字 和 static成員

explicit關鍵字 和 static成員 1、explicit 關鍵字2、static成員&#xff08;靜態成員變量屬于類的&#xff08;只有所屬這個類的對象才能修改&#xff09;&#xff0c;不同于全局變量&#xff08;任何對象都能修改&#xff09;&#xff09;2.1 定義和性質2.2 靜態成員的使用場…

opencv進階02-在圖像上繪制多種幾何圖形

OpenCV 提供了方便的繪圖功能&#xff0c;使用其中的繪圖函數可以繪制直線、矩形、圓、橢圓等多種幾何圖形&#xff0c;還能在圖像中的指定位置添加文字說明。 OpenCV 提供了繪制直線的函數 cv2.line()、繪制矩形的函數 cv2.rectangle()、繪制圓的函數cv2.circle()、繪制橢圓的…

【Quarkus技術系列】「云原生架構體系」在云原生時代下的Java“拯救者”是Quarkus,那云原生是什么呢?

云原生時代下的Java"拯救者" 在云原生時代&#xff0c;其實Java程序是有很大的劣勢的&#xff0c;以最流行的spring boot/spring cloud微服務框架為例&#xff0c;啟動一個已經優化好&#xff0c;很多bean需要lazy load的application至少需要3-4秒時間&#xff0c;內…

廣西一公司泄露22萬個人信息,被罰23萬

近日&#xff0c;廣西北海公安網安部門發現&#xff0c;北海某公司網站存在嚴重數據泄露問題&#xff0c;約22萬個人信息數據已掛在暗網售賣。 經查&#xff0c;涉案公司主要提供網上咨詢服務&#xff0c;在日常工作中收集了個人和企業等大量公民信息&#xff0c;但公司存放數…

【算法題】2547. 拆分數組的最小代價

題目&#xff1a; 給你一個整數數組 nums 和一個整數 k 。 將數組拆分成一些非空子數組。拆分的 代價 是每個子數組中的 重要性 之和。 令 trimmed(subarray) 作為子數組的一個特征&#xff0c;其中所有僅出現一次的數字將會被移除。 例如&#xff0c;trimmed([3,1,2,4,3,4…