大模型模型部署和暴露接口

創建環境

激活案件

安裝相關依賴

conda create -n fastApi python=3.10
conda activate fastApi
conda install -c conda-forge fastapi uvicorn transformers pytorch
pip install safetensors sentencepiece protobuf

?新建文件夾

mkdir App
cd App
touch main.py

復制代碼main.py

from fastapi import FastAPI
from transformers import AutoModelForCausalLM, AutoTokenizer
import torchapp = FastAPI()# 模型路徑
model_path = "/root/autodl-tmp/Models/deepseek-r1-1.5b-merged"# 加載 tokenizer (分詞器)
tokenizer = AutoTokenizer.from_pretrained(model_path)# 加載模型并移動到可用設備(GPU/CPU)
device = "cuda" if torch.cuda.is_available() else "cpu"
model = AutoModelForCausalLM.from_pretrained(model_path).to(device)@app.get("/generate")
async def generate_text(prompt: str):# 使用 tokenizer 編碼輸入的 promptinputs = tokenizer(prompt, return_tensors="pt").to(device)# 使用模型生成文本outputs = model.generate(inputs["input_ids"], max_length=150)# 解碼生成的輸出generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)return {"generated_text": generated_text}

運行app.py文件

uvicorn main:app --reload --host 0.0.0.0

?可能報錯,升級 huggingface-hub,運行以下命令升級到兼容版本

pip install --upgrade huggingface-hub
uvicorn main:app --reload --host 0.0.0.0

瀏覽器打開

http://localhost:8000/docs

后端接口?

?然后就是做一個網站調用大模型接口,類似如下

前端項目:https://github.com/huangyf2013320506/magic_conch_frontend.git

npm instal1
npm run dev

后端項目:https://github.com/huangyf2013320506/magic_conch_backend.git

記得把jdk改一下,之前一直用的是1.8

把網址改成"http://127.0.0.1:5173",因為前端網址是這?

?編譯一下?

?然后運行啟動就行,注意要在在MagicconchBackendApplication.java 類中啟動

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908750.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908750.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908750.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redis初入門

Nosql:Not-Only SQL(泛指非關系型數據庫),作為關系型數據庫的補充 作用:應對基于海量用戶和海量數據前提下的數據處理問題 redis:C語言開發的一個開源的高性能鍵值對數據庫 特征: 1、數據之…

【原神 × 二叉樹】角色天賦樹、任務分支和圣遺物強化路徑的算法秘密!

【原神 二叉樹】角色天賦樹、任務分支和圣遺物強化路徑的算法秘密! 作者:星之辰 標簽:#原神 #二叉樹 #天賦樹 #任務分支 #圣遺物強化 #算法科普 發布時間:2025年6月 總字數:6000+ 一、引子:提瓦特大陸的“樹型奧秘” 你是否曾留意過《原神》角色面板的天賦樹? 升級技能…

C++信息學競賽中常用函數的一般用法

在C 信息學競賽中,有許多常用函數能大幅提升編程效率。下面為你介紹一些常見函數及其一般用法: 一、比較函數 1、max()//求出a,b的較大值 int a10,b5,c;cmax(a,b);//得出的結果就是c等于10. 2、min()//求出a,b的較小值 int a1…

Linux【3】-----系統框架概述

系統架構 文件系統 linux一定需要掛載操作系統 一切皆文件 三個文件 引導文件 uboot.bin內核鏡像 zImage文件系統鏡像 system.img 設備樹文件(屬于內核) 應用程序編程 arm中通過軟中斷實現 各程序的構成 文件I/O 5種I/O模型 阻塞非阻塞信號多…

Tensorrt python api 10.11.0筆記

關于Tensorrt的python api文檔閱讀翻譯加總結 文檔源地址 Overview Getting started with TensorRT Installation(安裝) 安裝可參考:官方地址 Samples 關于樣例的內容可參考:樣例地址 Operator Documentation 有關更多信息(包括示例)&#xff0…

電鍍機的陽極是什么材質?

知識星球(星球名:芯片制造與封測技術社區,點擊加入)里的學員問:電鍍的陽極有什么講究?什么是可溶性陽極和非可溶性陽極? 什么是可溶性陽極與非可溶性陽極? 可溶性陽極 陽極本身就是…

前段三劍客之JavaScript-02

目錄 簡介 核心 函數 字符串對象 事件 運算符和控制語句 DOM 正則表達式 BOM JSON 簡介 JavaScript由JavaScript語法,DOM和BOM組成 JS中提供了一些輸入輸出語句: alert(); //瀏覽器彈出警示框 console.log(); //控制臺打印 prompt(); //瀏覽器…

Qiskit:量子計算模擬器

參考文獻: IBM Qiskit 官網Qiskit DocumentationQiskit Benchpress packageQiskit Algorithms package量子計算:基本概念常見的幾類矩陣(正交矩陣、酉矩陣、正規矩陣等)Qiskit 安裝指南-博客園使用Python實現量子電路模擬&#x…

【Elasticsearch】Elasticsearch 核心技術(二):映射

Elasticsearch 核心技術(二):映射 1.什么是映射(Mapping)1.1 元字段(Meta-Fields)1.2 數據類型 vs 映射類型1.2.1 數據類型1.2.2 映射類型 2.實際運用案例案例 1:電商產品索引映射案…

serv00 ssh登錄保活腳本-郵件通知版

適用于自己有服務器情況,ssh定時登錄到serv00,并在登錄成功后發送郵件通知 msmtp 和 mutt安裝 需要安裝msmtp 和 mutt這兩個郵件客戶端并配置,參考如下文章前幾步是講配置這倆客戶端的,很簡單,不再贅述 用Shell腳本實…

前端 Electron 桌面應用學習筆記

前端 Electron 桌面應用學習筆記 介紹Electron是什么?為什么選擇Electron?創建你的第一個桌面應用程序啟動項目運行結果截圖打開調試面板方法生命周期函數常用配置配置窗口標題配置小圖標隱藏菜單欄關閉調試面板是否可以使用Node.js隱藏 Electron 標題、小圖標和菜單欄獲取窗…

LeetCode - 94. 二叉樹的中序遍歷

題目 94. 二叉樹的中序遍歷 - 力扣(LeetCode) 什么是中序遍歷 二叉樹的中序遍歷是按照"左-根-右"的順序訪問二叉樹中的所有節點。 具體過程: 先遍歷左子樹(遞歸)然后訪問根節點最后遍歷右子樹&#xff…

PyTorch——搭建小實戰和Sequential的使用(7)

import torch from torch import nn from torch.nn import Conv2d, MaxPool2d, Flatten, Linearclass TY(nn.Module):def __init__(self):"""初始化TY卷積神經網絡模型模型結構:3層卷積池化,2層全連接設計目標:處理32x32像素的…

C#、VB.net——如何設置窗體應用程序的外邊框不可拉伸

以Visual studio 2015為例,具體操作如下: 1、將窗體的“FormBorderStyle”屬性值修改為“FixedSingle”: 2、點擊“格式”——“鎖定控件”: 這樣生成的程序邊框即可固定住,無法拉伸。

深入了解NIO的優化實現原理

網絡 I/O 模型優化 網絡通信中,最底層的就是內核中的網絡 I/O 模型了。隨著技術的發展,操作系統內核的網絡模型衍生出了五種 I/O 模型,《UNIX 網絡編程》一書將這五種 I/O 模型分為阻塞式 I/O、非阻塞式 I/O、I/O 復用、信號驅動式 I/O 和異步…

【前端】vue3性能優化方案

以下是Vue 3性能優化的系統性方案,結合核心優化策略與實用技巧,覆蓋渲染、響應式、加載、代碼等多個維度: ?? 一、渲染優化 精準控制渲染范圍 v-if vs v-show: v-if:條件為假時銷毀DOM,適合低頻切換場景&…

在MATLAB中使用自定義的ROS2消息

簡明結論: 無論ROS2節點和MATLAB運行在哪,MATLAB本機都必須擁有自定義消息源碼并本地用ros2genmsg生成,才能在Simulink里訂閱這些消息。只要你想讓MATLAB或Simulink能識別自定義消息,必須把消息包源碼(.msg等)拷到本機指定目錄&a…

spring重試機制

數據庫死鎖處理與重試機制實現指南 1. 業務場景 1.1 問題現象 高并發批量數據處理時頻繁出現數據庫死鎖主要發生在"先刪除歷史數據,再重新計算"的業務流程中原有逐條處理方式:list.forEach(item -> { delete(); calculate(); }) 1.2 死…

QEMU源碼全解析 —— 塊設備虛擬化(24)

接前一篇文章:QEMU源碼全解析 —— 塊設備虛擬化(23) 本文內容參考: 《趣談Linux操作系統》 —— 劉超,極客時間 《QEMU/KVM源碼解析與應用》 —— 李強,機械工業出版社 特此致謝! QEMU寫入一個文件的完整過程 前邊用了十來篇文章的篇幅,解析了QEMU啟動過程中的存儲…

java中static學習筆記

較重要知識點 static修飾的變量是共享的在類加載時創建可以不通過實例來訪問靜態方法只能訪問靜態的成員和方法;而非靜態的可以訪問靜態的和非靜態的。靜態方法一般用在通用的方法,這樣方便調用,不然一個通用的方法每一次調用都要創建實例&a…