使用MobileNetV3訓練水果分類模型并用Flask部署

前言

在計算機視覺領域,圖像分類是一個基礎且重要的任務。本文將介紹如何使用MobileNetV3預訓練模型來訓練一個水果分類模型,并通過Flask框架進行部署。MobileNetV3作為輕量級網絡,在保持較高精度的同時,具有較快的推理速度,非常適合實際應用場景。

環境準備

首先,我們需要準備以下環境:

# 主要依賴包
torch>=1.7.0
torchvision>=0.8.0
flask>=2.0.0
pillow>=8.0.0
numpy>=1.19.0
requests>=2.25.0  # 用于數據采集
matplotlib>=3.3.0  # 用于繪制訓練曲線

數據集準備

1. 數據采集

我們使用百度圖片API來采集水果圖片數據。以下是數據采集的代碼實現:

import requests
import osdef get_images(keyword, page_num):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}url = 'https://image.baidu.com/search/acjson?'# 設置圖片保存路徑download_path = os.path.join("./data", keyword)if not os.path.exists(download_path):os.makedirs(download_path)# 構造請求參數params = {'tn': 'resultjson_com','word': keyword,'pn': 0,'rn': 30,# ... 其他參數}# 下載圖片for i in range(page_num):params["pn"] = i*30response = requests.get(url, params=params, headers=headers)# 處理返回結果并保存圖片

2. 數據集組織

將采集到的圖片按照以下結構組織:

data/├── apple/│   ├── 0.jpg│   ├── 1.jpg│   └── ...├── banana/│   ├── 0.jpg│   ├── 1.jpg│   └── ...└── ...

模型訓練

1. 數據加載和預處理

from torchvision import transforms
from torchvision.datasets import ImageFolder
from torch.utils.data import random_split, DataLoader# 圖像預處理
transform = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])# 加載數據集
dataset = ImageFolder("data", transform=transform)# 保存類別標簽
with open("label.txt", "w", encoding="UTF-8") as f:for line in dataset.classes:f.write(line + "\n")# 劃分訓練集和測試集
train_ratio = 0.8
train_size = int(len(dataset) * train_ratio)
test_size = len(dataset) - train_size
train_dataset, test_dataset = random_split(dataset, [train_size, test_size])# 創建數據加載器
batch_size = 64
train_loader = DataLoader(train_dataset, batch_size=batch_size)
test_loader = DataLoader(test_dataset, batch_size=batch_size)

2. 模型定義

from torchvision import models
import torch.nn as nn# 使用MobileNetV3-Small預訓練模型
model = models.mobilenet_v3_small(pretrained=True)
# 修改最后的分類層
model.classifier[3] = nn.Linear(in_features=1024, out_features=5)  # 5個類別# 如果有GPU則使用GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = model.to(device)

3. 訓練過程

# 定義損失函數和優化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 訓練參數
num_epochs = 20
best_valid_acc = 0
best_model = None# 記錄訓練過程
train_losses = []
valid_losses = []
train_accs = []
valid_accs = []for epoch in range(num_epochs):# 訓練階段model.train()train_loss = 0.0train_acc = 0.0total = 0for inputs, labels in train_loader:inputs, labels = inputs.to(device), labels.to(device)optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()train_loss += loss.item()_, predicted = torch.max(outputs, 1)train_acc += (predicted == labels).sum().item()total += len(labels)

Flask部署

1. 創建Flask應用

2. 實現預測接口

@app.route('/predict', methods=['POST'])
def predict():if 'image' not in request.files:return render_template('index.html', prediction=None)image_file = request.files['image']image_data = image_file.read()# 圖像預處理img = Image.open(io.BytesIO(image_data))img = transform(img)img = torch.unsqueeze(img, dim=0)# 模型預測with torch.no_grad():prediction = model(img)prediction = F.softmax(prediction, dim=1)# 獲取預測結果pred_label = class_labels[torch.argmax(prediction).item()]confidence = torch.max(prediction).item()return render_template('index.html', prediction=pred_label,confidence=confidence)

部署步驟

  1. 確保服務器已安裝Python環境
  2. 安裝所需依賴包:
pip install -r requirements.txt

  1. 將模型文件、Flask應用和模板文件上傳到服務器
  2. 運行Flask應用:
python app.py

總結

本文詳細介紹了使用MobileNetV3訓練水果分類模型并用Flask部署的完整流程。通過使用預訓練模型,我們可以在較小的數據集上獲得不錯的分類效果。Flask框架的輕量級特性使得部署變得簡單快捷。在實際應用中,可以根據具體需求進行進一步的優化和改進。

參考資料

  1. MobileNetV3論文:Searching for MobileNetV3
  2. Flask官方文檔:https://flask.palletsprojects.com/
  3. PyTorch官方文檔:https://pytorch.org/docs/stable/index.html
  4. 百度圖片API文檔

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/85500.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/85500.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/85500.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SCADA技術與市場全景解析

SCADA系統作為工業自動化領域的關鍵組成部分,成為了工業企業推進數字化轉型的有力抓手。本文將重點介紹SCADA系統的發展歷程、系統構成及工作原理、發展趨勢,分析其行業應用差異,以及與物聯網和組態軟件的區別,梳理其在不同行業的…

在線教學課程視頻AI智能大綱代碼與演示

AI根據視頻內容自動生成視頻大綱,極大地提高了視頻內容的管理效率、可訪問性和用戶體驗,是推動視頻內容智能化發展的重要一環。AI根據視頻內容自動生成視頻內容大綱。這種功能,應用場景有哪些? 應用場景: 在線教育平臺…

動態WCMP+Flowlet ALB:雙引擎驅動智算網絡負載均衡

傳統網絡架構的困境 在 AI 算力爆發的今天,數據中心網絡正經歷前所未有的流量形態變革。傳統 Clos 網絡架構依賴逐流 ECMP 均衡算法,其設計邏輯基于 “大量短流” 假設,通過五元組 HASH 實現負載分擔。然而 AI 訓練場景呈現出鮮明的流量特征…

軟件測試題

選擇題 1、導致軟件缺陷的原因有很多,①—④是可能的原因,其中最主要的原因包括( )。 ①軟件需求說明書編寫的不全面,不完整,不準確,而且經常更改 ②軟件設計說明書 ③軟件操作人員的水平 ④開發人員不能很好的…

微信小程序頁面容器彈出層

效果圖 .JS Page({data: {show: false,duration: 300,position: right,round: false,overlay: true,customStyle: ,overlayStyle: },popup(e) {const position e.currentTarget.dataset.positionlet customStyle let duration this.data.durationswitch(position) {case to…

Excel批量計算時間差

執行以下操作,將自定義格式代碼應用到單元格: 選擇相應的單元格。在"開始"選項卡上的"數字"組中,單擊"常規"框旁邊的箭頭,然后單擊"其他數字格式"。在"設置單元格格式"對話框…

shell腳本--變量

1.變量是什么 2.變量類型 3.動態,靜態,強弱類型 4.變量的命名 5.變量的定義和引用 5.1三種變量類型 普通變量 環境變量 局部變量 5.2單引號,雙引號,強弱引用 雙引號對變量賦值的影響01:59:給變量加雙引號&#x…

大模型Text2SQL之在CentOS上使用yum安裝與使用MySQL

前言 學習大模型的時候需要一個mysql,原因還是在公司使用電腦的時候不允許按照Docker-Desktop,我的宿主機其實是MAC,我習慣上還是在centsos上面安裝,就發現這件過去很簡單的事情居然搗鼓了我蠻久,記錄一下。 容器環境 我直接安…

機器人大腦的進化:Physical Intelligence如何用“知識隔離“破解VLA模型三大難題

目錄 引言:當GPT遇上機器人手臂 第一章:VLM 與 VLA的介紹 VLM (Vision-Language Model) - 視覺語言模型 VLA (Vision-Language Agent) - 視覺語言智能體 VLM和VLA的對比 第二章:VLA模型的進化史 - 從"口述指揮"到"精確控…

LeetCode 662. 二叉樹的最大寬度

文章目錄 LeetCode 662. 二叉樹的最大寬度題目描述思路Golang 代碼 LeetCode 662. 二叉樹的最大寬度 記錄一次刷題的感悟。這道題目是我人生第一次面試的時候的手撕題目,但臨場的時候面試官沒有為難我,他考察的問題是求二叉樹的最大寬度,但是…

【linux】bash腳本中括號問題

在 Bash 腳本里,中括號 [ ] 其實是 test 命令的同義詞,[ 是一個命令,] 是該命令的最后一個參數,所以中括號內外的空格會影響命令執行,下面詳細說明: 中括號內側空格 中括號內側與操作數之間必須有空格&…

Ruoyi(若依)整合websocket實現信息推送功能(消息鈴鐺)

實現消息推送功能 來了,來了,大家做系統應該是最關心這個功能。 【思路】 需求:對全系統【所有的業務操作】進行消息推送,有【群發】、【私發】功能、處理【消息狀態(未讀/已讀)】,websocket持…

小白的進階之路系列之十五----人工智能從初步到精通pytorch綜合運用的講解第八部分

torch.nn 究竟是什么? PyTorch 提供了設計精良的模塊和類,如 torch.nn、torch.optim、Dataset 和 DataLoader,幫助你創建和訓練神經網絡。為了充分利用它們的能力并根據你的問題進行定制,你需要真正理解它們到底在做什么。為了幫助你理解這一點,我們將首先在不使用這些模…

JavaScript 數據結構詳解

最近在復習JavaScript的基礎知識,和第一次學確實有了很不一樣的感受,第一次學的比較淺,但是回頭再進行學習的時候,發現有很多遺漏的東西,所以今天想分享一下新學到的知識,后面會一點一點補充更新 JavaScrip…

c++面試題(14)------順時針打印矩陣

操作系統:ubuntu22.04 IDE:Visual Studio Code 編程語言:C11 題目描述 輸入一個矩陣,按照從外向里以順時針的順序依次打印出每一個元素。 例如: 輸入矩陣: [[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ] ]輸出&…

《Go語言圣經》defer

《Go語言圣經》defer 核心概念:defer語句的執行時機 defer是Go語言的一個關鍵字,它的作用是:延遲執行一個函數調用,該調用會在包圍它的函數返回前一刻執行。 關鍵點: defer語句會在函數即將返回時執行,…

WEB3 的 WebSocket Provider連接方式

1. 什么是 WebSocket Provider? WebSocket Provider 是 web3.js 中用于通過 WebSocket 協議 與以太坊節點(如 Infura、Geth、Parity)建立持久化連接的通信方式。它允許雙向實時數據傳輸,適用于需要實時監聽區塊鏈事件的場景。 核心特點 雙向通信:客戶端和服務器可以主動…

三國大模型:智能重構下的亂世文明圖譜

引言:當赤壁烽煙遇見深度學習 一件動態的《全本三國演義》正通過全息投影技術演繹群雄逐鹿的史詩。這個虛實交融的場景,恰似三國大模型技術的隱喻——以人工智能為紐帶,連接起漢末三國的烽火狼煙與數字時代的文明重構。作為人工智能與歷史學…

AWS數據庫遷移實戰:本地MySQL零停機上云方案

一、遷移場景 本地環境&#xff1a;自建MySQL 5.7&#xff08;數據量500GB&#xff09;&#xff0c;業務要求遷移停機時間<5分鐘 目標架構&#xff1a; 二、遷移四步法 步驟1&#xff1a;環境準備&#xff08;耗時30分鐘&#xff09; 1.1 創建Aurora MySQL # AWS CLI創…

uni-app 安卓 iOS 離線打包參考

App 離線打包 原生工程配置 安卓&#xff1a;【uniapp】uniapp 離線打包安卓應用或者云打包發布 app 步驟&問題記錄 iOS&#xff1a;uni-app實現XCode蘋果本地離線打包APP