用api的方式調用本地下載好的大模型(以llama為例,不是ollama!!!)

目錄

      • 1、創建虛擬環境
      • 2、激活虛擬環境
      • 3、安裝相關庫
      • 4、編寫腳本(test.py)
      • 調用腳本
      • 5、bash中測試通信
      • 完美結果

1、創建虛擬環境

conda create -n myenv python=3.12 -y

2、激活虛擬環境

conda activate myenv

3、安裝相關庫

pip install vllm fastapi uvicorn

4、編寫腳本(test.py)

from fastapi import FastAPI, Request
from vllm import LLM, SamplingParams
import uvicorn# Initialize FastAPI
app = FastAPI()# Load the model once at startup with adjusted parameters
model_path = "/home/zhengyihan/.cache/modelscope/hub/LLM-Research/Llama-3___2-3B-Instruct"
llm = LLM(model=model_path,max_model_len=8192,  # Reduced from defaultgpu_memory_utilization=0.95  # Increase memory allocation
)@app.post("/generate")
async def generate(request: Request):# Parse the request bodybody = await request.json()# Extract parameters from the requestprompt = body.get("prompt", "")temperature = body.get("temperature", 0.7)top_p = body.get("top_p", 0.95)max_tokens = body.get("max_tokens", 512)  # Reduced default# Set up sampling parameterssampling_params = SamplingParams(temperature=temperature,top_p=top_p,max_tokens=max_tokens)# Generate the responseoutputs = llm.generate(prompt, sampling_params)# Extract the generated textresults = []for output in outputs:results.append({"generated_text": output.outputs[0].text,"prompt": output.prompt})return {"results": results}if __name__ == "__main__":uvicorn.run(app, host="0.0.0.0", port=8000)

調用腳本

python test.py

5、bash中測試通信

curl -X POST http://localhost:8000/generate -H "Content-Type: application/json" -d '{"prompt": "Once upon a time"}'

完美結果

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/78194.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/78194.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/78194.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

算力網絡(CFN)在跨校聯合科研中的應用:安全性挑戰與聯邦調度實踐

引言:科研協作的算力困境 上海交通大學與麻省理工學院聯合開展的高能物理模擬實驗,因算力資源分配不均導致部分節點連續72小時處于空轉狀態。這個典型案例揭示了當前跨機構科研協作的痛點:?算力資源無法實現安全可信的細粒度共享?。算力網…

高防IP+CDN組合:電商大促的“雙保險”防護方案

引言 電商大促期間,平臺流量呈爆發式增長,既要應對瞬時激增的訪問量,又要防范黑客趁機發起的DDoS攻擊、惡意爬蟲等威脅。單一防護手段往往難以兼顧性能與安全,而高防IPCDN組合通過“流量清洗加速分發”的雙重機制,為電…

# 構建詞匯表:自然語言處理中的關鍵步驟

構建詞匯表:自然語言處理中的關鍵步驟 在自然語言處理(NLP)任務中,詞匯表(Vocabulary)是文本數據預處理的核心組件之一。它將文本中的單詞或字符映射為數值索引,從而讓計算機能夠理解和處理語言…

SQL進階知識:七、數據庫設計

今天介紹下關于數據庫設計的詳細介紹,并結合MySQL數據庫提供實際例子。 數據庫設計是確保數據庫能夠高效、安全地存儲和管理數據的關鍵環節。良好的數據庫設計可以提高查詢性能、減少數據冗余、確保數據完整性,并簡化數據維護。以下是關于數據庫設計的詳…

python如何取消word中的縮進

在python-docx中,取消縮進可以通過將相應的縮進屬性設置為None或0來實現。以下是取消不同類型縮進的方法: 取消左縮進 from docx import Documentdoc Document(existing_document.docx)for paragraph in doc.paragraphs:# 取消左縮進paragraph.paragr…

Docker拉取鏡像代理配置實踐與經驗分享

Docker拉取鏡像代理配置實踐與經驗分享 一、背景概述 在企業內網環境中,我們部署了多臺用于測試與學習的服務器。近期,接到領導安排,需在其中一臺服務器上通過Docker安裝n8n應用程序。然而在實際操作過程中,遭遇Docker官方鏡像庫…

【數字圖像處理】立體視覺基礎(1)

成像 成像過程:三維空間坐標到二維圖像坐標的變換 相機矩陣:建立三維到二維的投影關系 相機的使用步驟(模型-視圖變換): (1)視圖變換 (2)模型變換 (3&…

實驗4:列表與字典應用

目的 :熟練操作組合數據類型。 試驗任務: 1. 基礎:生日悖論分析。如果一個房間有23人或以上,那么至少有兩個人的生日相同的概率大于50%。編寫程序,輸出在不同隨機樣本數量下,23 個人中至少兩個人生日相同的…

c++之網絡編程

網絡編程:使得計算機程序能夠在網絡中發送和接受數據,從而實現分布式系統和網絡服務的功能。 作用:使應用程序能夠通過網絡協議與其他計算機程序進行數據交換 基本概念 套接字(socket): 套接字是網絡通信…

【Harmony_Bug】forEach + asyncawait 的異步陷阱

一、問題描述 今天在做一個RDB的小項目時,遇到一個問題,因為沒報錯其實也是不算是BUG,以下描述時我就直接說關鍵點,其他代碼忽略。 我的數據模型初始化有六條數據如圖 在持久化層,通過initUserData這個方法執行插入。…

大腸桿菌誘導蛋白時OD600=0.6-0.8添加IPTG的思考-實驗操作系列-009

一、為什么用OD600表示菌液濃度? 1. 光密度與吸光值的關系 OD600是指在600納米波長下的光密度(Optical Density),也就是通過細菌懸浮液的光的吸收程度。根據比爾-朗伯定律,光密度與溶液中光學活性物質(如…

OpenHarmony - 小型系統內核(LiteOS-A)(十),魔法鍵使用方法,用戶態異常信息說明

OpenHarmony - 小型系統內核(LiteOS-A)(十) 十四、魔法鍵使用方法 使用場景 在系統運行出現無響應等情況時,可以通過魔法鍵功能確定系統是否被鎖中斷(魔法鍵也無響應)或者查看系統任務運行狀態…

CUDA編程之Grid、Block、Thread線程模型

一、線程模型:Grid、Block、Thread概念 ?1. 層級定義? ?Thread(線程)? CUDA中最基本的執行單元,對應GPU的單個CUDA核心(SP)。每個線程獨立執行核函數指令,擁有獨立的寄存器和局部內存空間?。 ?Block(線程塊)? 由多個線程組成(通常為32的倍數),是邏輯上的并…

實戰交易策略 篇十九:君山居士熊市交易策略

文章目錄 系列文章熊市三大特征熊市操作思維強勢重勢,弱勢重質搶反彈重要前提和五大原則反彈逃頂操盤其他炒股的至高境界力戒“三進三出”八大心理誤區八大戒律股市不敗之法系列文章 實戰交易策略 篇一:奧利弗瓦萊士短線交易策略 實戰交易策略 篇二:杰西利弗莫爾股票大作手…

Flutter IOS 真機 Widget 錯誤。Widget 安裝后系統中沒有

錯誤信息: SendProcessControlEvent:toPid: encountered an error: Error Domaincom.apple.dt.deviceprocesscontrolservice Code8 "Failed to show Widget com.xxx.xxx.ServerStatus error: Error DomainFBSOpenApplicationServiceErrorDomain Code1 "T…

【計算機視覺】CV實戰項目 - 深入解析基于HOG+SVM的行人檢測系統:Pedestrian Detection

深入解析基于HOGSVM的行人檢測系統:從理論到實踐 技術核心:HOGSVM檢測框架HOG特征原理SVM分類器 項目架構與數據準備INRIA Person數據集目錄結構 實戰指南:從零構建檢測系統環境配置完整訓練流程檢測應用 關鍵技術問題與解決方案1. 難例挖掘不…

day01_編程語言介紹丶Java語言概述丶開發環境搭建丶常用DOS命令

編程語言介紹 ?編程語言是一種用于人與計算機之間通信的語言,允許程序員編寫代碼,這些代碼告訴計算機要執行哪些操作?。編程語言可以被視為計算機可以理解并執行的指令集合,它是一種標準化的交流技巧,用于向計算機發出指令。?…

告別默認配置!Xray自定義POC開發指南

文章涉及操作均為測試環境,未授權時切勿對真實業務系統進行測試! 下載與解壓 官網地址: Xray GitHub Releases 根據系統選擇對應版本: Windows:xray_windows_amd64.exe.zipLinux:xray_linux_amd64.zipmacOS:xray_darwin_amd64.zip解壓后得到可執行文件(如 xray_linux_…

C語言編程--17.有效的括號

題目: 給定一個只包括 ‘(’,‘)’,‘{’,‘}’,‘[’,‘]’ 的字符串 s ,判斷字符串是否有效。 有效字符串需滿足: 左括號必須用相同類型的右括號閉合。 左括號必須以正確的順序…

代碼隨想錄算法訓練營第60期第十七天打卡

今天我們繼續進入二叉樹的下一個章節,今天的內容我在寫今天的博客前大致看了一下部分題目難度不算大,那我們就進入今天的題目。 第一題對應力扣編號為654的題目最大二叉樹 這道題目的坑相當多,我第一次題目沒有看明白就是我不知道到底是如何…