3. 第三放平臺部署deepseek

有時候我們會發現使用deepseek服務器,異常卡頓,這是由于多方面原因造成的,比如說訪問人數過多等。想要解決這個問題,我們可以選擇第三方平臺進行部署

第三方平臺

我們可以選擇的第三方平臺很多,比如硅基流動、秘塔搜索、百度千帆等,常見平臺官網如下

  • 阿里云:https://pai.console.aliyun.com/#/quick-start/models.
  • 騰訊云:https://console.cloud.tencent.com/tione/v2/aimarket/detail/deepseek series?regionld=1&detailTab=introducee
  • cursor:https://cursor.com 需要cursor會員
  • grok:https://groq.com/蒸餾版llama 70b,中文能力不足
  • 國家超算中心:https://www.scnet.cn/ui/mall/
  • 硅基流動:https://siliconflow.cn/zh-cn/models

我們以硅基流動為例來介紹第三方平臺部署

部署

  1. 打卡硅基流動官網,我們可以看到他可以使用的模型在這里插入圖片描述

  2. 我們以V3模型為例來進行部署,點擊第一行第二個模型,他會出現模型的詳情信息在這里插入圖片描述

  3. 我們可以在線體檢,也可以看api文檔進行部署,我們打開API文檔,在左側我們可以看到它支持的接口在這里插入圖片描述,右側就是相關的例子了

  4. 我們以創建文本對話為例來進行部署,以官網為例寫下如下代碼

import requestsurl = "https://api.siliconflow.cn/v1/chat/completions"payload = {"model": "Qwen/QwQ-32B","messages": [{"role": "user","content": "What opportunities and challenges will the Chinese large model industry face in 2025?"}],"stream": False,"max_tokens": 512,"stop": None,"temperature": 0.7,"top_p": 0.7,"top_k": 50,"frequency_penalty": 0.5,"n": 1,"response_format": {"type": "text"},"tools": [{"type": "function","function": {"description": "<string>","name": "<string>","parameters": {},"strict": False}}]
}
headers = {"Authorization": "Bearer <token>","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

對于代碼解釋

這段代碼是使用 Python 的 requests 庫向 SiliconFlow API 發送一個 POST 請求,調用 Qwen/QwQ-32B 大語言模型,并獲取其對 “2025年中國大模型產業面臨的機遇與挑戰” 這個問題的回答。

1. 請求目標(API 端點)
url = "https://api.siliconflow.cn/v1/chat/completions"

? 這是 SiliconFlow 提供的 Chat Completions API,用于與大模型對話。

2. 請求數據(Payload)
payload = {"model": "Qwen/QwQ-32B",  # 指定調用的模型"messages": [{"role": "user",  # 用戶角色"content": "What opportunities and challenges will the Chinese large model industry face in 2025?"  # 用戶提問}],"stream": False,  # 是否流式返回(False 表示一次性返回完整回答)"max_tokens": 512,  # 限制返回的最大 token 數量(防止回答過長)"temperature": 0.7,  # 控制回答的隨機性(0-1,越高越有創意)"top_p": 0.7,  # 控制生成多樣性(類似 temperature)"top_k": 50,  # 限制采樣范圍(僅從 top_k 個最可能的 token 中選擇)"frequency_penalty": 0.5,  # 降低重復內容的概率"n": 1,  # 只生成 1 個回答"response_format": {"type": "text"},  # 返回純文本格式"tools": [...]  # (可選)用于函數調用,但這里未實際使用
}

? model: 指定調用的模型(這里是 Qwen/QwQ-32B)。
? messages: 對話歷史,這里只有用戶的一條提問。
? stream: 是否流式返回(False 表示一次性返回完整回答)。
? max_tokens: 限制回答長度(防止過長)。
? temperaturetop_ptop_k: 控制回答的隨機性和多樣性。
? frequency_penalty: 減少重復內容。
? tools: 可用于 函數調用(Function Calling)

3. 請求頭(Headers)
headers = {"Authorization": "Bearer <token>",  # 替換為你的 API Key"Content-Type": "application/json"  # 告訴服務器發送的是 JSON 數據
}

? Authorization: 需要替換 <token> 為你的 SiliconFlow API Key(否則會返回 401 未授權錯誤)。
? Content-Type: 指定數據格式為 application/json

4. 發送請求
response = requests.request("POST", url, json=payload, headers=headers)

? 使用 requests.post() 發送 POST 請求,傳遞 payload(JSON 格式)和 headers(包含認證信息)。

5. 打印響應
print(response.text)

? 打印 API 返回的 JSON 格式 的完整響應。

對于各個參數的取值,官網會有更詳細的說明,點擊

申請API KEY

在代碼中,我們需要替換<token>,也就是API KEY來進行正確的調用,所以我們應該先進行申請 API KEY

  1. 進入申請API KEY 的頁面,并登錄

  2. 點擊新建API KEY 在這里插入圖片描述

  3. 點擊余額充值,我們可以看到剩余的金額在這里插入圖片描述

  4. 新建好后,我們將API KEY替換,運行上面代碼,得到如下回答

{"id": "0195e27f092c94bd150980adec837ef5","object": "chat.completion","created": 1743261731,"model": "Qwen/QwQ-32B","choices": [{"index": 0,"message": {"role": "assistant","content": "","reasoning_content": "Okay, the user is asking about the opportunities and challenges the Chinese large model industry will face in 2025. Hmm, I need to break this down. First, I should consider what tools are available. The provided functions might include something like a market analysis tool or a future prediction model.\n\ nLooking at the tools given,there 's a function called \"analyze_market_trends\" which takes parameters like region, industry, and year. That seems relevant here. The user is focusing on China's large model industry,so region would be\ "China\", industry \"AI/ML\" or \"Large Language Models\", and year 2025.\n\nWait, the parameters for analyze_market_trends include region (string), industry (string), year (integer), and maybe others like specific_subsector. Since the question is about large models specifically, maybe adding \"large language models\" as the specific_subsector would help narrow it down.\n\nI should also check if there's another function called \"predict_future_impact\" which takes technology (string), region (string), timeframe (string like \"2025\"), and factors like economic, regulatory. That could cover both opportunities and challenges by considering different factors.\n\nSo combining both functions might give a comprehensive answer. First use analyze_market_trends to get market trends in China's AI/ML sector focusing on large models by 2025. Then use predict_future_impact to look at technological, economic, regulatory factors affecting them.\n\nWait but the user's question is about opportunities and challenges specifically. The functions might already capture that in their outputs. Let me make sure each function's parameters are correctly filled. For analyze_market_trends: region China, industry \"AI/ML\", year 2025, specific_subsector \"large language models\". For predict_future_impact: technology \"large language models\", region China, timeframe \"2025\", factors including economic, regulatory, technological.\n\nI need to structure the tool calls correctly in XML tags as specified. Each tool_call should be separate. Let me format that properly.\n","tool_calls": [{"id": "0195e27f26b353d40e8c41265d8faa9f","type": "function","function": {"name": "analyze_market_trends","arguments": "{\"region\": \"China\", \"industry\": \"AI/ML\", \"year\": 2025, \"specific_subsector\": \"large language models\"}"}}]},"finish_reason": "tool_calls"}],"usage": {"prompt_tokens": 140,"completion_tokens": 512,"total_tokens": 652},"system_fingerprint": ""
}

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/73857.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/73857.shtml
英文地址,請注明出處:http://en.pswp.cn/web/73857.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

1.4-蜜罐\堡壘機\API接口

1.4-蜜罐\堡壘機\API接口 蜜罐&#xff1a;用來釣魚或誘惑測試人員的防護系統 bash <(curl -sS -L https://hfish.net/webinstall.sh) # 安裝HFISH蜜罐堡壘機&#xff1a; 運維用的&#xff0c;統一管理運維平臺;拿下堡壘機就很有可能等于拿下了多個平臺 jumpServer一鍵安…

知識圖引導的檢索增強生成

摘要 檢索增強生成&#xff08;RAG&#xff09;已經成為一種很有前途的技術&#xff0c;用于解決大型語言模型&#xff08;LLM&#xff09;生成的響應中的幻覺問題。現有的RAG研究主要集中在應用基于語義的方法來提取孤立的相關組塊&#xff0c;忽略了它們之間的內在關系。在本…

【機器學習】imagenet2012 數據預處理數據預處理

【機器學習】數據預處理 1. 下載/解壓數據2. 數據預處理3. 加載以及訓練代碼3.1 使用PIL等加載代碼3.2 使用OpenCV的方式來一張張加載代碼3.3 h5的方式來加載大文件 最后總結 這個數據大約 140個G,128w的訓練集 1. 下載/解壓數據 首先需要下載數據&#xff1a; 數據最后處理…

質量工程:數字化轉型時代的質量體系重構

前言&#xff1a;質量理念的范式轉移閱讀原文 如果把軟件開發比作建造摩天大樓&#xff1a; 傳統測試 竣工后檢查裂縫&#xff08;高成本返工&#xff09; 質量工程 從地基開始的全流程監理體系&#xff08;設計圖紙→施工工藝→建材選擇→竣工驗收&#xff09; IEEE研究…

【全棧開發】—— Paddle OCR 文字識別 + deepseek接入(基于python 最新!!!)

所有源碼都在文章中&#xff0c;大家不要私信來要源碼&#xff0c;當然&#xff0c;評論區歡迎交流技術 目錄 Paddle OCR 配置環境 示例 deepseek接入 環境配置 api 調用代碼 sliconflow Paddle OCR 配置環境 清華源下載 paddlepaddle&#xff1a; pip install paddlepaddle …

SAIL-RK3588J 核心板技術方案——高精度裝配式建筑機器人控制?

&#xff08;本方案契合《建筑機器人產業目錄》政策要求&#xff09; 一、方案背景與政策支持? ?政策驅動? 2025年2月《建筑機器人產業目錄》明確將?“高精度建筑機器人控制設備”?納入重點補貼范圍&#xff0c;要求定位精度≤0.5mm、支持實時質檢與多機協同&#xff0c…

OpenAI API - 快速入門開發

文章目錄 開發者快速入門分析圖像輸入使用工具擴展模型提供閃電般的 AI 體驗構建代理進一步探索 模型精選模型推理模型旗艦聊天模型成本優化模型實時模型舊版 GPT 模型DALLE文本轉語音轉寫嵌入調度工具特定模型GPT 基礎模型 Libraries創建和導出 API 密鑰安裝官方 SDKJavaScrip…

藍橋杯省賽 棋盤 3533 二維差分+二維前綴和

傳送門 0棋盤 - 藍橋云課 const int N 2e3 10;int n,m; int a[N][N];void insert(int x11,int y11,int x22,int y22) {a[x11][y11] ;a[x11][y22 1] --;a[x22 1][y11] --;a[x22 1][y22 1] ; }void solve() {cin >> n >> m;for (int i 1;i < m;i ){int x11…

《C++Linux編程進階:從0實現muduo 》-第6講.C++死鎖問題如何分析調試-原子操作,互斥量,條件變量的封裝

重點內容 視頻講解&#xff1a;《CLinux編程進階&#xff1a;從0實現muduo C網絡框架系列》-第6講.C死鎖問題如何分析調試-原子操作,互斥量,條件變量的封裝 代碼改動 lesson6代碼 實現&#xff1a;base/Atomic.h 實現&#xff1a;base/Mutex.h 實現&#xff1a;base/Condit…

洛谷題單1-P5708 【深基2.習2】三角形面積-python-流程圖重構

題目描述 一個三角形的三邊長分別是 a a a、 b b b、 c c c&#xff0c;那么它的面積為 p ( p ? a ) ( p ? b ) ( p ? c ) \sqrt{p(p-a)(p-b)(p-c)} p(p?a)(p?b)(p?c) ?&#xff0c;其中 p 1 2 ( a b c ) p\frac{1}{2}(abc) p21?(abc)。輸入這三個數字&#xff…

matplotlib標題比x,y軸字體大,明明標題字體更大?

原始代碼&#xff1a; plt.xlabel(訓練輪次&#xff08;Epochs&#xff09;, fontsize14, fontweightbold, fontpropertieschinese_font) # 設置中文字體、加大、加粗 plt.ylabel(R值, fontsize14, fontweightbold, fontpropertieschinese_font) # 設置中文字體、加大、加粗…

Baklib內容中臺的核心優勢是什么?

智能化知識管理引擎 Baklib的智能化知識管理引擎通過多源數據整合與智能分類技術&#xff0c;實現企業知識資產的自動化歸集與動態更新。系統內置的語義分析算法可自動識別文檔主題&#xff0c;結合自然語言處理技術生成結構化標簽體系&#xff0c;大幅降低人工標注成本。針對…

Android學習總結之ContentProvider跨應用數據共享

在 Android 開發中&#xff0c;跨應用數據共享是構建開放生態的關鍵需求。作為四大組件之一&#xff0c;ContentProvider通過標準化接口和安全機制&#xff0c;成為實現這一需求的核心樞紐。本文將圍繞其生命周期方法、核心機制、自定義實現及最佳實踐展開&#xff0c;幫助開發…

計算機底層基石:原碼、反碼、補碼、移碼深度剖析

在計算機的世界里&#xff0c;所有數據最終都以二進制的形式進行存儲與運算。原碼、反碼、補碼和移碼作為二進制數據的重要編碼方式&#xff0c;對計算機實現高效數據處理起著關鍵作用。接下來&#xff0c;我們將深入剖析這幾種編碼。? 一、原碼? 1.1 定義? 原碼是最簡單…

Bitnode和Bitree有什么區別 為什么Bitree前多了*

Bitnode 和 Bitree 的區別在于它們的類型定義和用途&#xff1a; Bitnode: 這是一個結構體類型&#xff0c;表示二叉樹中的一個節點。 它包含三個成員&#xff1a; data&#xff1a;存儲節點的數據&#xff08;這里是 char 類型&#xff09;。 lchild&#xff1a;指向左子節點…

AI 時代,我們該如何寫作?

當ChatGPT/DeepSeek能在幾秒鐘內產出一篇文章&#xff0c;而且生成能力日益精進&#xff0c;你是否也曾思考&#xff0c;我還能做什么&#xff1f; 當2024年AI開始進入人們的視野&#xff0c;我在CSDN 上的博客也悄然發生了變化&#xff0c;以前一篇文章發布后&#xff0c;閱讀…

第三卷:覆舟山決戰(73-108回)正反人物群像

第三卷&#xff1a;覆舟山決戰&#xff08;73-108回&#xff09;正反人物群像 核心矛盾&#xff1a;寒門稱帝→權力異化→歷史循環 主題&#xff1a;通過人物群像展現屠龍者成魔的必然性與制度壓迫的永恒性 一、正派陣營&#xff08;理想主義殘余&#xff09; 1. 檀道濟&…

vscode 通過Remote-ssh遠程連接服務器報錯 could not establish connection to ubuntu

vscode 通過Remote-ssh插件遠程連接服務器報錯 could not establish connection to ubuntu&#xff0c;并且出現下面的錯誤打印&#xff1a; [21:00:57.307] Log Level: 2 [21:00:57.350] SSH Resolver called for "ssh-remoteubuntu", attempt 1 [21:00:57.359] r…

Nginx RTMP DASH 模塊分析 (ngx_rtmp_dash_module.c)

ngx_rtmp_dash_module.c實現了一個 Nginx RTMP 模塊&#xff0c;主要功能是支持通過 DASH&#xff08;動態自適應流媒體&#xff09;協議進行流媒體發布。DASH&#xff08;Dynamic Adaptive Streaming over HTTP&#xff09;是一種流行的視頻流協議&#xff0c;它允許根據網絡狀…

飛書電子表格自建應用

背景 coze官方的插件不支持更多的飛書電子表格操作&#xff0c;因為需要自建應用 飛書創建文件夾 創建應用 開發者后臺 - 飛書開放平臺 添加機器人 添加權限 創建群 添加剛剛創建的機器人到群里 文件夾邀請群 創建好后&#xff0c;就可以拿到id和key 參考教程&#xff1a; 創…