華為云Flexus+DeepSeek征文|DeepSeek-V3/R1 免費服務開通全流程與Rest API和OpenAI SDK調用詳解

華為云Flexus+DeepSeek征文|DeepSeek-V3/R1 免費服務開通全流程與Rest API和OpenAI SDK調用詳解

前言

本文將詳細介紹DeepSeek-V3/R1 免費服務開通全流程,并且詳細講解通過本地方式Rest API和OpenAI SDK兩種方式調用DeepSeek-V3/R1

前提準備

1、訪問 ModelArts Studio_MaaS大模型即服務平臺華為云

官網地址:ModelArts Studio大模型即服務平臺

官方教程文檔:官網文檔
2、進入ModelArts Studio控制臺在這里插入圖片描述

3、接受服務服務聲明

在這里插入圖片描述

4、點擊在線推理,授權委托

在這里插入圖片描述

5、勾選委托并且創建

在這里插入圖片描述

6、服務授權

在這里插入圖片描述

7、確認授權

在這里插入圖片描述

免費服務開通

1、免費服務:僅適合用于體驗模型,且受嚴格的速率限制。平臺可能會不定時調整其適用模型、免費額度、有效期等內容。(免費服務中單個模型提供200萬token推理額度,額度消耗完后可開通使用商用級別的推理API服務(僅限貴陽一),或前往我的服務部署為我的服務后付費使用)

在這里插入圖片描述

2、領取額度

在這里插入圖片描述

3、領取成功

在這里插入圖片描述

免費服務在線體驗

1、點擊在線體驗

在這里插入圖片描述

2、這里可以進行提問體驗感受DeepSeek-V3/R1的能力

在這里插入圖片描述

3、參數調配(可以根據需求調配不同的參數,讓大模型更加智能)

參數說明
溫度/Temperature設置推理溫度。 - 數值較高,輸出結果更加隨機。 - 數值較低,輸出結果更加集中和確定。 取值范圍:0-2 默認值:不同模型的默認值不同,請以實際環境為準。
核采樣/top_p設置推理核采樣。調整輸出文本的多樣性,數值越大,生成文本的多樣性就越高。 取值范圍:0.1~1 默認值:不同模型的默認值不同,請以實際環境為準。
top_k選擇在模型的輸出結果中選擇概率最高的前K個結果。 取值范圍:1~1000 默認值:20

在這里插入圖片描述

4、體驗感受

  • 我的提問
DeepSeek-V3-32K是什么,能做什么
  • DeepSeek-V3/R1的回答
DeepSeek-V3-32K 是什么?
DeepSeek-V3-32K 是深度求索(DeepSeek)公司開發的一款先進的大型語言模型(LLM)。它基于最新的深度學習技術,具備強大的自然語言處理(NLP)能力,能夠理解和生成人類語言。以下是其核心特點:32K 上下文長度:
模型支持高達 32,000 token 的上下文長度,這意味著它可以處理更長的文本輸入,保持對上下文的理解和連貫性,適合長文檔、復雜對話和多輪交互場景。多模態能力:
除了文本處理,DeepSeek-V3-32K 可能還支持圖像、音頻等多模態數據的處理,能夠實現跨模態的理解和生成。高精度和高效性:
模型經過大規模數據訓練高精度的語言理解和生成能力,同時優化了計算效率,適用于多種應用場景。可定制化:
支持針對特定行業或任務的微調和定制,以滿足用戶的個性化需求。DeepSeek-V3-32K 能做什么?
DeepSeek-V3-32K 的應用場景非常廣泛,以下是一些主要功能:文本生成:撰寫文章、報告、故事、。
生成營銷文案、社交媒體內容。
自動摘要長篇文章或文檔。
對話與問答:構建智能客服系統,提供即時、準確的回答。
實現多輪對話,支持復雜問題的解答。
作為虛擬助手,協助用戶完成日常任務。
翻譯與多語言支持:支持多種語言之間的高質量翻譯。
跨語言溝通和文檔處理。
代碼生成與編程輔助:自動生成代碼片段或完整程序。
提供編程問題解答和調試建議。
輔助開發人員進行代碼優化。
數據分析與洞察:從大量文本數據中提取關鍵信息。
生成數據報告和可視化圖表。
幫助用戶發現數據中的模式和趨勢。
教育與:提供個性化學習建議和知識講解。
自動生成練習題和考試題目。
輔助教師進行課程設計和內容開發。
創意與設計:生成創意文案、廣告語、品牌名稱等。
輔助設計工作,如生成圖像描述或設計靈感。
多模態應用:結合圖像和音頻數據進行跨模態生成如生成圖像描述或語音轉文字。
支持多模態內容的創作和編輯。
適用場景
企業應用:智能客服、自動化文檔處理、市場分析、員工培訓等。
教育領域:在線教學、學習輔助、課程開發等。
創意產業:內容創作、廣告設計、媒體制作等。
科研與技術:數據分析、代碼開發、學術研究等。
--- 總結DeepSeek-V3-32K 是一款功能強大、靈活多變的大型語言模型,能夠滿足多種場景下的自然語言處理需求。其超長的上下文支持和多模態能力使其在復雜任務中表現出色,同時其可定制化特性也為企業和個人用戶提供了高度適配的解決方案。

在這里插入圖片描述

免費服務API調用

API KEY獲取

1、點擊調用說明可以查看API調用 方法

在這里插入圖片描述

2、按照調用說明的步驟進行操作

  • Rest API調用和OpenAI SKD調用兩種方式

在這里插入圖片描述

3、步驟一: 獲取API Key

  • 點擊API KEY管理-創建API KEY

在這里插入圖片描述

  • 創建API KEY(輸入標簽和描述)

在這里插入圖片描述

  • 保存密鑰(請將此密鑰保存在安全且可訪問的地方。這是唯一一次可以查看密鑰的機會。您以后將無法查看它。但您可以隨時創建新的訪問密鑰)

在這里插入圖片描述

  • 密鑰創建獲取成功即完成了步驟一

在這里插入圖片描述

Rest API調用

1、步驟二: 復制調用示例并替換接口信息、API Key

打開pycharm平臺,將調用示例代碼復制并替換對應的參數信息

  • 復制下方調用示例代碼
  • 替換其中的接口信息(API地址、模型名稱)為上方接口信息
  • 替換其中的API Key為已獲取的API Key

在這里插入圖片描述

2、pychram粘貼代碼

在這里插入圖片描述

3、運行代碼(如下顯示則為調用成功)

如下報錯信息不影響知識一種警告(這個警告信息是由 urllib3 庫發出的,提示你正在向 api.modelarts-maas.com 發送未經驗證的 HTTPS 請求)

在這里插入圖片描述

OpenAI SDK調用

1、點擊OpenAI SDK

在這里插入圖片描述

2、pycharm安裝環境(pycharm終端進行環境安裝)

pip install --upgrade "openai>=1.0"

在這里插入圖片描述

3、如果出校網絡超時,或者報錯預計是國外鏡像源太慢了更換國內鏡像源進行下載

pip install --upgrade "openai>=1.0" -i https://pypi.tuna.tsinghua.edu.cn/simple

在這里插入圖片描述

4、復制調用代碼

在這里插入圖片描述

5、粘貼入pycharm命令行

此處有三個地方需要根據自己的修改

  • API地址
  • API Key
  • 模型名稱

在這里插入圖片描述

6、運行代碼,如果出現如下報錯代表問題出在處理流式響應的方式上,設置stream=True時,OpenAI API 返回的是一個生成器對象,需要迭代它來獲取完整內容,而不是直接訪問choices屬性

在這里插入圖片描述

  • 修改代碼如下
# coding=utf-8from openai import OpenAIbase_url = "API地址" # API地址
api_key = "API Key" # 替換為實際API Keyclient = OpenAI(api_key=api_key, base_url=base_url)response = client.chat.completions.create(model = "DeepSeek-V3", # 模型名稱messages = [{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "你好"},],temperature = 1,stream = True
)# 處理流式響應
full_response = ""
for chunk in response:# 先確認choices列表長度大于0if len(chunk.choices) > 0 and chunk.choices[0].delta.content is not None:full_response += chunk.choices[0].delta.contentprint(full_response)

官方實例代碼可能會報錯所以此處我對代碼做了一定的修改,主要修改了

  1. 流式響應處理:使用for chunk in response遍歷生成器,獲取每個數據塊
  2. 增量內容提取:通過chunk.choices[0].delta.content獲取每個數據塊中的實際文本內容
  3. 內容拼接:將所有數據塊的內容累積到full_response
  4. 訪問choices[0]之前,添加了len(chunk.choices) > 0的檢查,以此保證列表不為空

7、成功運行(如下則表示調用成功)

在這里插入圖片描述

8、官方實例不能夠實現持續對話,如果要實現終端中的持續對話,你需要在現有代碼基礎上添加一個循環結構,讓用戶可以不斷輸入問題,并持續接收 AI 的回答。以下是修改后的代碼:

此處有三個地方需要根據自己的修改

  • API地址
  • API Key
  • 模型名稱
# coding=utf-8from openai import OpenAIbase_url = "API地址"  # API地址
api_key = "替換為實際API Key"  # 替換為實際API Keyclient = OpenAI(api_key=api_key, base_url=base_url)# 初始化對話歷史
messages = [{"role": "system", "content": "You are a helpful assistant"}]print("開始對話 (輸入'退出'結束)")while True:# 獲取用戶輸入user_input = input("\n你: ")# 檢查退出條件if user_input.lower() == "退出":print("對話已結束")break# 添加用戶消息到對話歷史messages.append({"role": "user", "content": user_input})# 調用APIresponse = client.chat.completions.create(model="DeepSeek-V3", # 模型名稱messages=messages,temperature=1,stream=True)# 處理流式響應print("AI:", end="", flush=True)full_response = ""for chunk in response:if len(chunk.choices) > 0 and chunk.choices[0].delta.content is not None:content = chunk.choices[0].delta.contentfull_response += contentprint(content, end="", flush=True)# 添加AI回復到對話歷史messages.append({"role": "assistant", "content": full_response})

在這里插入圖片描述

本地部署免費服務DeepSeek-V3

使用這個改進后的代碼,可以與 DeepSeek-V3 模型進行多輪對話,模型會根據完整的對話歷史生成回復,就像在聊天應用中一樣

這段代碼通過調用 DeepSeek-V3 API 實現持續對話功能:

  • 初始化消息歷史并循環獲取用戶輸入
  • 將用戶消息添加到歷史中發送請求
  • 處理流式響應實時顯示回復內容
  • 將完整回復追加到歷史以保持對話上下文
  • 支持輸入 “exit” 終止對話并處理可能的異常

此處也有三個地方需要根據自己的修改

  • API地址
  • API Key
  • 模型名稱
# coding=utf-8import requests
import json
import urllib3# 禁用不安全請求警告(僅用于測試環境)
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)def main():url = "https://api.modelarts-maas.com/v1/chat/completions" # API地址api_key = "yourApiKey"  # 把yourApiKey替換成已獲取的API Key # 初始化消息歷史,包含系統提示messages = [{"role": "system", "content": "You are a helpful assistant."}]headers = {'Content-Type': 'application/json','Authorization': f'Bearer {api_key}'}print("==== 開始對話 ====")print("輸入 'exit' 結束對話")while True:# 獲取用戶輸入user_input = input("\n你: ")if user_input.lower() == "exit":break# 添加用戶消息到歷史messages.append({"role": "user", "content": user_input})# 準備請求數據data = {"model": "DeepSeek-V3",	# 模型名稱"messages": messages,"stream": True,"temperature": 0.6}try:# 發送請求response = requests.post(url, headers=headers, data=json.dumps(data), verify=False, stream=True)if response.status_code == 200:print("助手: ", end='', flush=True)full_response = ""# 處理流式響應for line in response.iter_lines():if line:line = line.decode('utf-8')if line.startswith('data: '):data = line[6:]if data != '[DONE]':try:json_data = json.loads(data)if 'choices' in json_data and len(json_data['choices']) > 0:delta = json_data['choices'][0].get('delta', {})content = delta.get('content', '')if content:print(content, end='', flush=True)full_response += contentexcept json.JSONDecodeError as e:print(f"\n解析響應時出錯: {e}")# 添加助手回復到消息歷史if full_response:messages.append({"role": "assistant", "content": full_response})print()  # 換行else:print(f"\n請求失敗,狀態碼: {response.status_code}")print(response.text)except requests.exceptions.RequestException as e:print(f"\n請求異常: {e}")breakif __name__ == '__main__':main()

在這里插入圖片描述

免費服務模型體驗-文本對話

1、進入模型體驗中心

在這里插入圖片描述

2、免費服務模型體驗

在這里插入圖片描述

3、體驗成功

在這里插入圖片描述

總結

華為云Flexus整合DeepSeek-V3/R1提供低成本高效開發路徑:通過ModelArts Studio快速開通免費服務,基于Rest API和OpenAI SDK兼容調用實現V3對話生成與R1邏輯推理,結合MoE架構靈活適配輕量/復雜場景,顯著縮短開發周期并降低資源成本。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/910189.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/910189.shtml
英文地址,請注明出處:http://en.pswp.cn/news/910189.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Qt 連接信號使用lambda表達式和槽函數的區別

1. 語法與代碼結構 成員函數 需在類中顯式聲明槽函數(public slots: 或 Qt 5 后的任意成員函數),并在連接時指定接收對象。 class Receiver : public QObject {Q_OBJECT public slots:void handleSignal(int value) { /* ... */ } };// 連接…

學習筆記丨AR≠VR:透視沉浸式技術的“虛實象限”法則

AR(增強現實)和VR(虛擬現實)是沉浸式技術的兩大分支,核心區別在于虛擬與現實的融合程度。以下是兩者的詳細對比: 對比維度 AR(增強現實) VR(虛擬現實) 技術…

本地使用 modelscope 大模型 來進行文本生成視頻(Text-to-Video)

1. ? 創建并激活 Conda 環境(Python 3.8) conda create -n modelscope python3.8 -yconda activate modelscope 2.? 安裝了 PyTorch(CPU 版本) 如果你是 CPU-only 用戶(沒有 NVIDIA 顯卡 或不想用 GPU&#xff0…

文生視頻(Text-to-Video)

🕒 生成時間:每張圖大概 10–60 秒(取決于設備) ? 二、文生視頻(Text-to-Video) 以下項目中,很多都基于 SD 模型擴展,但視頻生成復雜度高,生成時間一般 超過 30 秒&am…

CLion + STM32環境配置,親測有效(2025.06.19記)

CLion STM32環境配置 遇到的問題描述: > "moniton" command not supported by this target. > You cant do that when your target is exec > 上傳完成,但存在問題 > monitor reset > "monitor" command not …

借助ChatGPT快速開發圖片轉PDF的Python工具

一、開發背景與適用場景 隨著數字文檔處理需求的激增,圖片轉PDF的需求日益廣泛。從學生提交圖像化作業,到教師整合掃描試卷等資料,再到行政人員歸檔證件照片,工作中的方方面面都離不開圖片的處理。如何高效、批量地將多個圖片文件…

SuGAR代碼精簡解讀

目錄 一、全流程訓練腳本 train_full_pipeline.py 二、核心訓練邏輯 train.py 粗優化 (coarse_density_and_dn_consistency.py) 網格提取 (extract_mesh_from_coarse_sugar) 精優化 (refined_training) 兩次優化(粗優化和精優化)中使用的損失函數及…

大模型安全關鍵技術研究

? 引言 隨著人工智能技術的迅猛發展,大模型已成為推動各行業變革的核心力量。從智能客服、醫療影像識別到金融風險預測,大模型的應用場景不斷拓展,深刻改變著人們的生產生活方式。大模型已經轉變為AI領域的基礎設施,為解決各種…

java面試題04成員變量和局部變量的區別

成員變量(Member Variable)和局部變量(Local Variable)是面向對象編程中兩種作用域和生命周期不同的變量,主要區別體現在以下幾個方面: 1. 聲明位置 成員變量: 聲明在類內部、方法/構造器/代碼塊外部。 例如: public class Person {// 成員變量(實例變量)private Str…

升級到 .NET 9 分步指南

隨著激動人心的 .Net 9 更新正式發布,漫長的等待終于結束了。它帶來了一些令人驚嘆的特性,例如改進的 LINQ 功能、HybridCache 等等。此外,憑借其卓越的性能提升、更佳的安全性、更完善的協議和更易維護的特性,它必將吸引開發者和…

day30打卡

# 導入模塊 import math print("方式1:使用 import math") print(f"圓周率π的值:{math.pi}") print(f"2的平方根:{math.sqrt(2)}\n") # 導入特定項 from math import pi, sqrt print("方式2&#…

優化數據庫查詢

優化數據庫查詢 在實際開發中,數據庫查詢的性能直接關系到系統響應速度和用戶體驗。尤其在高并發環境下,低效的SQL語句會成為瓶頸,導致系統負載升高,甚至引發宕機。因此,查詢優化是數據庫性能優化中最為關鍵的一環。 為了系統性地理解數據庫查詢優化策略,本節將從SQL語…

【LeetCode#第198題】打家劫舍(一維dp)

198. 打家劫舍 - 力扣(LeetCode) 你是一個專業的小偷,計劃偷竊沿街的房屋。每間房內都藏有一定的現金,影響你偷竊的唯一制約因素就是相鄰的房屋裝有相互連通的防盜系統,如果兩間相鄰的房屋在同一晚上被小偷闖入&#…

微前端MFE:(React 與 Angular)框架之間的通信方式

在 微前端&#xff08;MFE, Micro Frontends&#xff09; 中使用 CustomEvent 是非常常見的&#xff0c;尤其是在不同子應用&#xff08;Micro Apps&#xff09;之間通信的時候。今天將以React 主應用 ? Angular 子應用 之間的通信進行示例 React 主應用 <-> Angular 子…

408考研逐題詳解:2010年第1題——理解棧的基本操作

2010年第1題 若元素 a&#xff0c;b&#xff0c;c&#xff0c;d&#xff0c;e&#xff0c;f 依次進棧&#xff0c;允許進棧、退棧操作交替進行&#xff0c;但不允許連續三次進行退棧操作&#xff0c;則不可能得到的出棧序列是&#xff08; &#xff09; A. dcebfa \qquad B.…

python追加合并excel效率記錄

第一種合并方法&#xff1a; 在sheet的第一行&#xff0c;追加新表concat舊表 read_excel讀取舊表全部 to_excel新表追加寫入舊表 需要的時間&#xff1a; 第二種合并方法&#xff1a; 在sheet的最后一行&#xff0c;直接追加新表 load_book只讀用來獲取舊表sheet行數 read_ex…

公鑰加密與簽名算法計算詳解(含計算題例子)

一、RSA 加密算法 密鑰生成&#xff1a; 選兩個大素數 p 和 q計算 n p q計算 φ(n) (p-1)(q-1)選整數 e 滿足 1 < e < φ(n) 且 gcd(e, φ(n)) 1計算 d 滿足 d e ≡ 1 mod φ(n) 公鑰&#xff1a;(e, n) 私鑰&#xff1a;(d, n) 加密&#xff1a; c ≡ m? mod…

63 網絡交互的過程中目標設備的選擇

前言 這里主要是 調研一下 發送網絡數據包的過程中 選擇網絡設備 比如 向本機發送信息, 走的是 lo 向局域網其他主機發送信息, 走無線網卡 或者 有線網卡 基于 linux 的調試 這里主要是基于 ping 192.168.1.2 的調試 skb->dev 的初始化是在 skb->_skb_refdst 初…

DE2-115板子上用 Verilog編程實現一個分秒計數器

一、實驗目的 掌握 Verilog 語言在硬件描述中的應用&#xff0c;通過編程實現分秒計數器的邏輯功能。 學習并實踐按鍵消抖的原理與實現方法&#xff0c;提升對硬件電路中信號處理的理解。 熟悉在 DE2-115 開發板上進行 Verilog 程序的開發、調試及下載驗證流程&#xff0c;將…

R4 LSTM-火災溫度預測

import tensorflow as tf import pandas as pd import numpy as npgpus tf.config.list_physical_devices("GPU") if gpus:tf.config.experimental.set_memory_growth(gpus[0], True) #設置GPU顯存用量按需使用tf.config.set_visible_devices([gpus[0]],&…