Pytorch筆記一之 cpu模型保存、加載與推理

Pytorch筆記一之 cpu模型保存、加載與推理

1.保存模型

首先,在加載模型之前,我們需要了解如何保存模型。PyTorch 提供了兩種保存模型的方法:保存整個模型和僅保存模型的狀態字典(state dict)。推薦使用第二種方式,因為它更靈活且體積較小。

import torch
import torch.nn as nn# 定義一個簡單的神經網絡
class SimpleNN(nn.Module):def __init__(self):super(SimpleNN, self).__init__()self.fc = nn.Linear(10, 2)def forward(self, x):return self.fc(x)# 實例化模型并進行訓練
model = SimpleNN()
# 模型訓練過程(省略)# 保存模型的狀態字典
torch.save(model.state_dict(), 'simple_nn.pth')

2. 加載模型

一旦你保存了模型,接下來就可以加載它。在加載過程中,確保模型的架構與訓練時一致。以下是加載模型的步驟:

  • 1.創建一個模型實例
  • 2.調用 load_state_dict() 方法加載狀態字典

代碼示例如下:

# 重新定義模型架構
model = SimpleNN()# 加載模型狀態字典
model.load_state_dict(torch.load('simple_nn.pth', map_location=torch.device('cpu')))

3. 在 CPU 上進行推理

完成模型加載后,接下來就可以使用模型進行推理。以下是一個簡單的示例:

# 模擬輸入數據
input_data = torch.randn(1, 10)# 在 CPU 上進行推理
with torch.no_grad():  # 禁用梯度計算,節省內存output = model(input_data)print(output)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/96169.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/96169.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/96169.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

當AI在代碼車間組裝模塊:初級開發者的創意反成「核心算法」

前言:哈嘍,大家好,今天給大家分享一篇文章!并提供具體代碼幫助大家深入理解,徹底掌握!創作不易,如果能幫助到大家或者給大家一些靈感和啟發,歡迎收藏關注哦 💕 目錄當AI在…

技術視界 | 跨域機器人通信與智能系統:打破壁壘的開源探索

8 月 16 日,在 OpenLoong 社區舉辦的第九期線下分享會上,國家地方共建人形機器人創新中心的軟件開發負責人 Amadeus 博士帶來了一場主題為“跨域機器人通信與智能系統:打破行業壁壘的創新方案”的演講。深入探討了當前機器人領域的一個關鍵痛…

Android入門到實戰(八):從發現頁到詳情頁——跳轉、傳值與RecyclerView多類型布局

一. 引言在上一篇文章里,我們從零開始實現了 App 的 發現頁面,通過網絡請求獲取數據,并使用 RecyclerView 展示了劇集列表。但光有發現頁還不夠,用戶在點擊一部劇時,自然希望進入到一個更詳細的頁面,去查看…

【工具】41K star!網頁一鍵變桌面應用

項目中遇到了一個需要將現有的 web 頁面打包成一個 桌面應用 的需求。 最一開始想到的是 Electron,但是它還需要一些開發工作并且打包后的應用體積比較大,調研后發現了開源工具 Pake。 它能讓你用最輕量的方式,把任何網頁一鍵打包成跨平臺桌…

浪潮CD1000-移動云電腦-RK3528芯片-2+32G-安卓9-2種開啟ADB ROOT刷機教程方法

浪潮CD1000-移動云電腦-RK3528芯片-232G-安卓9-2種開啟ADB ROOT刷機教程方法 往期文章: 浪潮CD1000-移動云電腦-RK3528芯片-232G-安卓9-開啟ADB ROOT破解教程 地址1:浪潮CD1000-移動云電腦-RK3528芯片-232G-開啟ADB ROOT破解教程-CSDN博客 中國移動浪潮…

Day23_【機器學習—聚類算法—K-Means聚類 及評估指標SSE、SC、CH】

一、聚類算法概念屬于無監督學習算法,即有特征無標簽,根據樣本之間的相似性,將樣本劃分到不同的類別中。所謂相似性可以理解為歐氏距離、曼哈頓距離、切比雪夫距離... 。分類按顆粒度分為:粗聚類、細聚類。按實現方法分為&#xf…

android seekbar顯示刻度

SeekBar簡介 SeekBar是Android中的一個可交互UI組件,允許用戶通過拖動滑塊在特定范圍內選擇數值。繼承自ProgressBar,但增加了用戶手動調節功能,常用于音量控制、亮度調節等場景。 核心屬性 android:maxHeight // 背景高度 android:progres…

【高并發內存池】五、頁緩存的設計

文章目錄Ⅰ. page cache頁緩存的結構設計Ⅱ. 完善central cache中的 get_span() 函數Ⅲ. 實現頁緩存獲取span對象的接口Ⅰ. page cache頁緩存的結構設計 ? 首先頁緩存還是一個哈希桶的結構,但是和前兩者不同的是,頁緩存的哈希桶中存放的是一個或者多個…

Elasticsearch(text和keyword)區別分析

text:全文檢索類型,經過分詞處理,支持模糊匹配? keyword:精確匹配類型,適用于聚合、排序和過濾? text 1. 核心屬性 ?analyzer屬性?: 指定用于索引和搜索的分詞器 默認使用標準分析器(Standard Analyzer) 示例:"analyzer": "ik_max_word"(中文…

通過tailscale實現一臺電腦上vscode通過ssh連接另一臺電腦上的VMware Linux 虛擬機

當需要通過一臺windows電腦上的vscode來ssh連接另一臺電腦上的linux虛擬機進行遠程操作,可以通過tailscale來實現。 Linux虛擬機上安裝tailscale 由于掛代理下載仍然很慢,而清華鏡像源又沒有tailscale的軟件包,所以可以通過下載 DEB 包安裝…

[Upscayl圖像增強] docs | 前端 | Electron工具(web->app)

鏈接:https://upscayl.org/docs:Upscayl Upscayl是一款桌面應用程序,允許用戶使用人工智能放大和增強圖像。 提供了一個用戶友好的圖形界面(渲染器用戶界面),用戶可以選擇圖像或文件夾,從多種AI…

阿里云通義MoE全局均衡技術:突破專家負載失衡的革新之道

MoE模型的基本原理與核心價值 混合專家模型(Mixture of Experts,MoE)是當前AI大模型領域最重要的架構創新之一,其核心思想是通過多個“專家”網絡協同處理輸入數據,并由門控網絡動態選擇或組合各個專家的輸出&#xf…

macOS中設置環境變量的各文件及作用域

在 macOS 中,~/.zshrc 和 ~/.bash_profile 是 Shell 的配置文件,用于設置環境變量、命令別名、啟動命令等。它們在你每次打開終端時會被自動加載。文件對應 Shell作用~/.zshrcZsh(macOS Catalina 及以后默認)每次打開新的終端窗口…

【華為培訓筆記】OptiX OSN 9600 設備保護專題

OptiX OSN 9600 設備保護專題 1、光層保護 定義 方式 應用

Python開篇撬動未來的萬能鑰匙 從入門到架構的全鏈路指南

💝💝💝歡迎蒞臨我的博客,很高興能夠在這里和您見面!希望您在這里可以感受到一份輕松愉快的氛圍,不僅可以獲得有趣的內容和知識,也可以暢所欲言、分享您的想法和見解。 持續學習,不斷…

LabVIEW 與 PLC 通訊

在工業自動化領域,LabVIEW 與 PLC 的通訊極為關鍵,它能實現設備間高效的數據交互與協同運作。接下來,將從應用場景、軟件架構、功能實現、特點、開發問題及解決方法等層面展開闡述。 應用場景? 智能工廠生產線監控系統中,LabVIE…

11-FreeRTOS任務相關的其他API函數

數據來源地址:gitee.com FreeRTOS任務相關的其他API函數 一、FreeRTOS任務相關的其他API函數介紹 1、FreeRTOS任務相關API函數介紹(部分常用的) 答: 二、任務狀態查詢API函數 1、獲取任務優先級函數 答: UBaseType_t uxTaskPriorityGet…

ECMAScript(2)核心語法課件(Node.js/React 環境)

📚 ECMAScript 核心語法課件(Node.js/React 環境) 1. 變量與作用域 變量聲明方式 var:函數作用域,存在變量提升(hoisting)console.log(a); // undefined(變量提升) var a…

Selenium 頁面加載超時pageLoadTimeout與 iframe加載關系解析

引言 在 Web 自動化測試中,處理頁面加載超時是每個 Selenium 使用者都會遇到的挑戰。特別是當頁面包含 iframe 時,加載行為變得更加復雜。許多測試工程師困惑于:pageLoadTimeout 究竟能否控制 iframe 的加載?本文將深入探討這一問…

AI面試將重塑企業招聘流程:從效率到精準度的全面升級

每年校招季,HR團隊總被“面試官不夠用”“簡歷太多看不清”“候選人放鴿子”等問題折磨。傳統招聘流程冗長、成本高昂、標準參差,已難以適應快速變化的用人需求。而AI面試技術的突破,正在從底層邏輯上重塑招聘鏈條——從初篩到終面&#xff0…