阿里云人工智能大模型通義千問Qwen3開發部署

本文主要描述阿里云人工智能大模型開源社區ModelScope提供的通義千問Qwen3開發部署。

與阿里云一起

輕松實現數智化

讓算力成為公共服務:用大規模的通用計算,幫助客戶做從前不能做的事情,做從前做不到的規模。讓數據成為生產資料:用數據的實時在線,幫助客戶以數據為中心改變生產生活方式創造新的價值。


Qwen3 亮點

Qwen3 是 Qwen 系列中最新一代的大規模語言模型,提供了一系列密集型和專家混合(MoE)模型。基于廣泛的訓練,Qwen3 在推理、指令執行、代理能力和多語言支持方面實現了突破性進展,具有以下關鍵特性:

在單一模型內無縫切換思考模式(用于復雜的邏輯推理、數學和編程)和非思考模式(用于高效的通用對話),確保在各種場景下的最佳性能。

顯著增強其推理能力,在數學、代碼生成和常識邏輯推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。

優越的人類偏好對齊,擅長創意寫作、角色扮演、多輪對話和指令執行,提供更加自然、吸引人和沉浸式的對話體驗。

在代理能力方面的專長,能夠在思考和非思考模式下與外部工具精確集成,并在復雜代理任務中達到開源模型中的領先性能。

支持 100 多種語言和方言,具有強大的多語言指令執行和翻譯能力。


模型概述

Qwen3-0.6B 具有以下特點:

類型:因果語言模型

訓練階段:預訓練 & 后訓練

參數數量:0.6B

非嵌入參數數量:0.44B

層數:28

注意力頭數(GQA):Q 為 16,KV 為 8

上下文長度:32,768


開發環境搭建

ModelScope社區是阿里云通義千問開源的大模型開發者社區。

圖片

如上所示,安裝ModelScope社區大模型基礎庫開發框架的命令行參數,使用清華大學提供的鏡像地址

圖片

圖片

如上所示,在JetBrains PyCharm的項目工程終端控制臺中,安裝深度學習基礎庫開發框架pytorch

圖片

圖片

如上所示,在JetBrains PyCharm的項目工程終端控制臺中,安裝深度學習基礎庫開發框架tensorflow

圖片

圖片

如上所示,在JetBrains PyCharm的項目工程終端控制臺中,安裝ModelScope社區大模型基礎庫開發框架

圖片

如上所示,在JetBrains PyCharm的項目工程終端控制臺中,安裝ModelScope社區大模型多模態領域開發框架

圖片

圖片

如上所示,在JetBrains PyCharm的項目工程的測試代碼中,使用分詞器對原文執行分析操作,輸出分詞列表


運行千問大模型

https://www.modelscope.cn/models/Qwen/Qwen3-0.6B/files

如上所示,從ModelScope社區的模型倉庫下載開源的千問大模型到本地

如上所示,在代碼中引入預訓練的模型庫源文件,初始化分詞器以及模型實例

如上所示,在代碼中設置用戶的提問信息,使用分詞器的文本對話模版、設置文本對話模版的屬性,其中,包括開啟文本對話模版的思考模式,使用分詞器初始化用戶的輸入問題信息

如上所示,在代碼中使用模型實例對輸入的分詞列表執行生成操作,從大模型實例中獲取用戶問題的答復

如上所示,在代碼中使用分詞器對大模型的答復執行解碼操作,解碼包括思考部分的答復以及非思考部分的答復


阿里云人工智能大模型百煉運行部署

SGLANG_USE_MODELSCOPE=true python -m sglang.launch_server --model-path Qwen/Qwen3-0.6B --reasoning-parser qwen3

如上所示,使用開源SGLANG運行環境部署大模型的命令行

VLLM_USE_MODELSCOPE=true vllm serve Qwen/Qwen3-0.6B --enable-reasoning --reasoning-parser deepseek_r1

如上所示,使用開源VLLM運行環境部署大模型的命令行


切換思考模式和非思考模式

默認情況下,Qwen3 啟用了思考能力,類似于 QwQ-32B。這意味著模型將利用其推理能力來提高生成響應的質量。例如,在顯式設置 enable_thinking=True 或在 tokenizer.apply_chat_template 中使用默認值時,模型將進入思考模式。

如上所示,在代碼中使用思考模式,模型會生成用 <think>...</think> 的輸出標簽返回思考模式的生成內容

如上所示,在代碼中使用非思考模式,模型不會生成任何思考內容,并且不會包含 <think>...</think>輸出標簽


高級用法:通過用戶輸入切換思考模式和非思考模式

我們提供了一種軟開關機制,允許用戶在 enable_thinking=True 時動態控制模型的行為。具體來說,您可以在用戶提示或系統消息中添加 /think 和 /no_think 來逐輪切換模型的思考模式。在多輪對話中,模型將遵循最新的指令。

如上所示,在代碼中定義通用函數,用于加載模型、初始化分詞器、初始化模型實例、生成用戶問題的答復

如上所示,在代碼中使用默認的思考模式提問

如上所示,在代碼中使用非思考模式提問

如上所示,在代碼中使用思考模式提問


使用MCP協議代理集成

Qwen3在工具調用能力方面表現出色。我們推薦使用Qwen-Agent來最好地利用Qwen3的代理能力。Qwen-Agent內部封裝了工具調用模板和解析器,極大地減少了編碼復雜度。

要定義可用工具,您可以使用MCP配置文件、使用Qwen-Agent集成的工具,或者自行集成其他工具。

如上所示,在代碼中定義MCP代理服務器端的LLM開放接口服務,其中,包括服務器地址以及授權認證屬性信息

如上所示,在代碼中定義MCP代理服務器端提供的工具命令

如上所示,在代碼中使用MCP代理服務器端的工具命令實現對話功能

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/80795.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/80795.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/80795.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

24.(vue3.x+vite)引入組件并動態掛載(mount)

示例截圖 組件代碼: <template><div><div>{{message }}</div>

《Python星球日記》 第56天:循環神經網絡(RNN)入門

名人說:路漫漫其修遠兮,吾將上下而求索。—— 屈原《離騷》 創作者:Code_流蘇(CSDN)(一個喜歡古詩詞和編程的Coder??) 目錄 一、序列數據的特點與挑戰1. 什么是序列數據?2. 序列數據的挑戰二、RNN 的基本結構與前向傳播1. RNN的核心理念2. RNN的數學表達3. RNN的前向傳…

手寫 vue 源碼 === computed 實現

目錄 計算屬性的基本概念 計算屬性的核心實現 ComputedRefImpl 類的實現 ReactiveEffect 與計算屬性的關系 計算屬性的工作流程 1. 創建計算屬性 2. 依賴收集過程 3. 嵌套 effect 的處理 4. 更新過程 嵌套 effect 關系圖解 依賴關系建立過程 代碼實現分析 1. 創建…

【Lattice FPGA 開發】Diamond在線調試Reveal邏輯亂跳的解決

在Vivado中在always塊中寫邏輯時如果出現always塊中的異步復位敏感詞在塊內部未使用的情況&#xff0c;如下例的rst&#xff1a; always (posedge clk or posedge rst) begin if(~tx_sense_flag)o_rd_adr < d1;else if((o_rd_adr d94) & (bit_cnt d7))o_rd_adr <…

【hadoop】Sqoop數據遷移工具的安裝部署

一、Sqoop安裝與配置 步驟&#xff1a; 1、使用XFTP將Sqoop安裝包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz發送到master機器的主目錄。 2、解壓安裝包&#xff1a; tar -zxvf ~/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 3、修改文件夾的名字&#xff0c;將其改為s…

BUUCTF——PYWebsite

BUUCTF——PYWebsite 進入靶場 看看基本信息 沒有什么信息 掃個目錄看看 http://node5.buuoj.cn:28115/.DS_Store http://node5.buuoj.cn:28115/flag.php http://node5.buuoj.cn:28115/index.html訪問flag.php 提示保存購買者的IP 抓包看看 直接XFF偽造一下 X-Forwarded-F…

基于Qt開發的多線程TCP服務端

目錄 一、Qt TCP服務端開發環境準備1. 項目配置2. 核心類說明二、服務端搭建步驟詳解步驟1:初始化服務端對象步驟2:啟動端口監聽步驟3:處理客戶端連接三、數據通信與狀態管理1. 數據收發實現2. 客戶端狀態監控四、進階功能擴展1. 多客戶端并發處理2. 心跳檢測機制五、調試與…

【Tools】VScode使用CMake構建項目

這里寫目錄標題 vscode 使用 CMake**安裝插件**新建CMake項目 vscode 使用 CMake 安裝插件 CMake和CMake Tools c等等 CMake插件主要功能是CMake語法高亮、自動補全CMake Tools的功能主要是結合VSCode IDE使用CMake這個工具&#xff0c;比如生成CMake項目、構建CMake項目等…

neo4j圖數據庫基本概念和向量使用

一.節點 1.新建節點 create (n:GroupProduct {name:都邦高保額團意險,description: "保險產品名稱"} ) return n CREATE&#xff1a;Neo4j 的關鍵字&#xff0c;用于創建新節點或關系。 (n:GroupProduct)&#xff1a; n 是節點的臨時別名&#xff08;變量名&#…

2025年滲透測試面試題總結-滲透測試紅隊面試八(題目+回答)

網絡安全領域各種資源&#xff0c;學習文檔&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各種好玩的項目及好用的工具&#xff0c;歡迎關注。 目錄 滲透測試紅隊面試八 二百一十一、常見中間件解析漏洞利用方式 二百一十二、MySQL用戶密碼存儲與加密 …

大語言模型主流架構解析:從 Transformer 到 GPT、BERT

&#x1f4cc; 友情提示&#xff1a; 本文內容由銀河易創AI&#xff08;https://ai.eaigx.com&#xff09;創作平臺的gpt-4-turbo模型生成&#xff0c;旨在提供技術參考與靈感啟發。文中觀點或代碼示例需結合實際情況驗證&#xff0c;建議讀者通過官方文檔或實踐進一步確認其準…

Java設計模式之裝飾器模式:從基礎到高級的全面解析(萬字解析)

裝飾器模式(Decorator Pattern)是一種結構型設計模式,它允許向一個現有的對象添加新的功能,同時又不改變其結構。這種模式創建了一個裝飾類,用來包裝原有的類,并在保持類方法簽名完整性的前提下,提供了額外的功能。 一、裝飾器模式基礎概念 1.1 什么是裝飾器模式 裝飾…

RN 鴻蒙混合開發實踐(踩坑)

#三方框架# #React Native # 1 。環境配置&#xff1b; 安裝 DevEco 開發工具&#xff1b; Node 版本16&#xff1b; hdc環境配置 hdc 是 OpenHarmony 為開發人員提供的用于調試的命令行工具&#xff0c;鴻蒙 React Native 工程使用 hdc 進行真機調試。hdc 工具通過 OpenHa…

動態網站 LNMP

一、名詞解釋&#xff1a; LNMP&#xff1a; L : 代表 Linux 操作系統&#xff0c;為網站提供了可靠的運行環境N : 代表 Nginx&#xff0c;它是一款輕量級的高性能 Web 服務器&#xff0c;能夠快速處理大量并 發連接&#xff0c;有效提升網站的訪問速度和性能 M : 代表…

DAY04:Vue.js 指令與事件處理深度解析之從基礎到實戰

1. 指令系統核心概念 1.1 插值表達式與基礎指令 Vue.js 的指令系統是其響應式編程模型的核心&#xff0c;我們首先從最基礎的插值表達式開始&#xff1a; <div id"app"><!-- 基礎文本插值 --><p>{{ message }}</p><!-- JavaScript 表達…

12配置Hadoop集群-集群配置

&#xff08;一&#xff09;Hadoop的組成 對普通用戶來說&#xff0c; Hadoop就是一個東西&#xff0c;一個整體&#xff0c;它能給我們提供無限的磁盤用來保存文件&#xff0c;可以使用提供強大的計算能力。 在Hadoop3.X中&#xff0c;hadoop一共有三個組成部…

Kubernetes生產實戰(四):kubelet日志快速定位指南

kubelet作為Kubernetes節點的核心管家&#xff0c;其日志是排查節點問題的金鑰匙。本文將分享生產環境中查看和分析kubelet日志的完整方案&#xff0c;助你快速定位節點級故障。 一、基礎操作&#xff1a;快速查看日志 1. systemd服務日志&#xff08;推薦首選&#xff09; …

麥科信獲評CIAS2025金翎獎【半導體制造與封測領域優質供應商】

在蘇州舉辦的2025CIAS動力能源與半導體創新發展大會上&#xff0c;深圳麥科信科技有限公司憑借在測試測量領域的技術積累&#xff0c;入選半導體制造與封測領域優質供應商榜單。本屆大會以"新能源芯時代"為主題&#xff0c;匯集了來自功率半導體、第三代材料應用等領…

Python實例題:pygame開發打飛機游戲

目錄 Python實例題 題目 pygame-aircraft-game使用 Pygame 開發的打飛機游戲腳本 代碼解釋 初始化部分&#xff1a; 游戲主循環&#xff1a; 退出部分&#xff1a; 運行思路 注意事項 Python實例題 題目 pygame開發打飛機游戲 pygame-aircraft-game使用 Pygame 開發…

Gin 框架入門

Gin 框架入門 一、響應數據 JSON 響應 在 Web 開發中&#xff0c;JSON 是一種常用的數據交換格式。Gin 提供了簡便的方法來響應 JSON 數據。 package mainimport ("github.com/gin-gonic/gin" )func main() {r : gin.Default()r.GET("/json", func(c *…