阿里開源Qwen3:大語言模型的新突破

一、模型概覽:豐富的模型家族

Qwen3 系列包含了 2 款混合專家(MoE)模型與 6 款密集(Dense)模型,參數量覆蓋范圍極廣,從 0.6B 一直延伸至 235B 。其中,旗艦模型 Qwen3 - 235B - A22B 總參數量高達 2350 億,不過其激活參數僅 220 億,借助 MoE 架構實現了 “動態資源分配”,這是一個極為關鍵的特性,在后文性能表現部分會詳細闡述它如何發揮作用。而小型 MoE 模型 Qwen3 - 30B - A3B 總參數約 300 億,激活參數 30 億 。6 款 Dense 模型則分別為 Qwen3 - 0.6B、1.7B、4B、8B、14B、32B,不同的參數量可以滿足多樣化的應用場景和部署需求。
qwen3介紹

二、核心特性:混合推理模式引領新方向

創新的雙模式設計

Qwen3 作為國內首個支持 “思考模式” 與 “非思考模式” 的混合推理模型,在模型響應策略上實現了重大突破。在思考模式下,模型面對復雜邏輯、數學推理等任務時,會啟動多步驟深度推理,就像一位深思熟慮的學者,逐步剖析問題,最終輸出嚴謹的結果。例如在解決復雜的數學證明題或者邏輯推理謎題時,思考模式能夠讓模型有條不紊地梳理思路,找到問題的關鍵所在。而非思考模式則如同敏捷的短跑選手,對于簡單任務能夠迅速做出低算力 “秒級響應” 。比如回答常見的事實性問題,像 “今天天氣如何”“中國的首都是哪里” 等,非思考模式能快速給出答案,極大地提高了處理效率。這種雙模式設計,使得模型在效率與精度之間找到了完美的平衡。

推理能力大幅提升

在多個權威基準測試中,Qwen3 展現出了驚人的性能。在奧數水平的 AIME25 測評中,它斬獲 81.5 分,刷新了開源模型的紀錄,這一成績充分證明了其在復雜數學推理方面的深厚功底。在代碼能力測試 LiveCodeBench 中,它突破 70 分大關,超越了 Grok3,說明其在代碼生成、理解和應用方面的能力十分卓越。在模型人類偏好對齊評估 ArenaHard 中,Qwen3 以 95.6 分的成績超越了 OpenAI - o1 和 DeepSeek - R1 。此外,在 GPQA、AIME24/25 等測試中也表現出色,全面超越了 DeepSeek - R1、OpenAI - o1 等全球頂尖模型。這些測試結果表明,Qwen3 在推理能力上已經達到了行業領先水平。

qwen3 info

多語言支持能力強大

Qwen3 支持 119 種語言和方言,涵蓋了印歐語系、漢藏語系、亞非語系、南島語系等多個語系。這一廣泛的多語言能力為全球用戶提供了極大的便利,無論是跨國企業進行多語言文檔處理、翻譯,還是全球化的智能客服系統,Qwen3 都能輕松應對,開創了國際應用的新可能性。

三、性能優勢:小參數,大能量

小型模型的卓越表現

小型 MoE 模型 Qwen3 - 30B - A3B 的激活參數僅為 QwQ - 32B 的 10%,卻取得了更優的表現,這體現了 Qwen3 在模型架構和訓練優化上的巨大成效。甚至像 Qwen3 - 4B 這樣參數規模相對較小的模型,也能媲美 Qwen2.5 - 72B - Instruct 的性能水平 。這種高效的性能表現,使得 Qwen3 系列模型在實際應用中,尤其是在資源受限的場景下,具有顯著優勢。例如在移動端設備或者邊緣計算場景中,小參數模型能夠以較低的計算資源消耗實現較高的性能輸出。

模型性能與成本的平衡

業界分析認為,Qwen3 在參數量減少的情況下實現高性能,并非簡單的裁剪,而是通過更高效的計算方式和知識蒸餾技術實現的。例如,Qwen3 引入動態稀疏激活機制,僅在必要時調用關鍵參數,從而降低計算冗余。這一改進使其在資源受限場景(如移動端或邊緣設備)中更具部署潛力。以企業部署為例,原本需要大量計算資源和高昂成本才能運行的復雜 AI 應用,現在借助 Qwen3 的高效模型,可以在相對低成本的硬件配置下實現同樣甚至更好的效果。

四、訓練與優化:數據與方法的雙重升級

數據規模翻倍

預訓練數據量從 Qwen2.5 的 18 萬億 token 擴展至 36 萬億 token,新增 119 種語言及方言支持,涵蓋了 PDF 文檔解析、STEM 領域教材、代碼片段等高質量數據。為了構建這個龐大的數據集,團隊不僅從網絡收集數據,還利用 Qwen2.5 - VL 視覺模型輔助提取文檔文本,結合 Qwen2.5 - Math 與 Qwen2.5 - Coder 合成數學及代碼數據,通過多渠道多方式的數據整合與處理,使得模型在專業領域的理解能力顯著增強 。例如在處理專業的學術文獻、代碼項目文檔時,Qwen3 能夠憑借豐富的數據訓練基礎,更好地理解其中的專業術語、邏輯結構和語義信息。

四階段訓練流程

通過 “長思維鏈冷啟動 - 強化學習 - 模式融合 - 通用優化” 四階段后訓練,Qwen3 實現推理能力與響應速度的深度整合。在第一階段,使用多樣化的長思維鏈數據微調模型,涵蓋各種任務和領域,如數學、編程、邏輯推理和 STEM 問題,這個過程旨在使模型具備基本的推理能力。第二階段專注于擴大強化學習的計算資源,利用基于規則的獎勵來增強模型的探索和利用能力。第三階段,在一份包括長思維鏈數據和常用的指令微調數據的組合數據上對模型進行微調,將非思考模式整合到思考模型中,確保了推理和快速響應能力的無縫結合。最后,在第四階段,將強化學習應用于超過 20 個通用領域任務,包括指令遵循、格式遵循和 Agent 能力等任務,以進一步增強模型的一般能力并糾正不良行為 。通過這樣系統且精細的訓練流程,Qwen3 在性能上實現了質的飛躍。

五、開源與應用:推動大模型生態發展

阿里巴巴開源了 Qwen3 的全部 8 個模型版本,包括 2 款 MoE 模型(Qwen3 - 235B - A22B 和 Qwen3 - 30B - A3B)以及 6 款 Dense 模型(Qwen3 - 0.6B、1.7B、4B、8B、14B、32B) 。Qwen3 系列模型均采用寬松的 Apache 2.0 協議開源,全球開發者可在 Hugging Face、ModelScope 等平臺免費下載商用。這一開源舉措無疑將極大地推動大模型技術的發展,吸引全球開發者基于 Qwen3 進行二次開發和創新應用。阿里還同步推出 Qwen - Agent 框架,封裝工具調用模板,降低智能體開發門檻,推動 “模型即服務” 生態落地。在實際應用方面,Qwen3 的多語言支持和強大的推理能力使其在多個領域具有廣闊的應用前景。在金融領域,可基于 Qwen3 - 32B 構建智能投研系統,幫助分析師快速分析市場數據、挖掘投資機會;在教育領域,可用 4B 模型開發個性化學習助手,根據學生的學習情況和問題提供精準的解答和學習建議。

Qwen3 來了!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/903827.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/903827.shtml
英文地址,請注明出處:http://en.pswp.cn/news/903827.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數字智慧方案5856丨智慧環保綜合解決方案(50頁PPT)(文末有下載方式)

資料解讀:智慧環保綜合解決方案 詳細資料請看本解讀文章的最后內容。 隨著城市化進程的加速和環境問題的日益嚴峻,智慧環保成為提升城市環境管理水平的重要手段。本文將對智慧環保綜合解決方案進行詳細解讀,探討其在實際應用中的需求、解決…

基于ssm的網盤管理系統(全套)

一、系統架構 前端:vue | element-ui 后端:spring | springmvc | mybatis 環境:jdk1.8 | mysql | maven | tomcat | nodejs 二、代碼及數據庫 三、功能介紹 01. 注冊 02. 登錄 03. 管理員-首頁 04. 管理員-個人中心 …

PostgreSQL 的 VACUUM 與 VACUUM FULL 詳解

PostgreSQL 的 VACUUM 與 VACUUM FULL 詳解 一、基本概念對比 特性VACUUMVACUUM FULL定義常規維護操作,清理死元組激進重組操作,完全重寫表數據鎖級別不阻塞讀寫(共享鎖)排他鎖(阻塞所有操作)空間回收只標記空間為可用,不返還OS空間返還操作…

復刻低成本機械臂 SO-ARM100 舵機配置篇(WSL)

視頻講解: 復刻低成本機械臂 SO-ARM100 舵機配置篇(WSL) 飛特舵機 組裝之前需要配置舵機的ID,如下的網址為舵機的資料,實際上用不到,但可以mark在這里 Software-深圳飛特模型有限公司 User Guide里面可以…

Tailwind CSS實戰技巧:從核心類到高效開發

使用 Kooboo平臺 訓練實戰技巧,無需配置安裝,直接引入CDN就可以在線練習了!具體操作流程:進入Kooboo后,選擇創建空白站點 -> 站點開發 -> 控制面板 -> 頁面 ->新建普通頁面 -> 編寫代碼 一、核心布局類…

【LINUX操作系統】線程操作

了解了線程的基本原理之后,我們來學習線程在C語言官方庫中的寫法與用法。 1. 常見pthread接口及其背后邏輯 1.1 pthread_create 與線程有關的函數構成了?個完整的系列,絕?多數函數的名字都是以“pthread_”打頭的 ? 要使?這些函數庫,…

【AI面試準備】Azure DevOps沙箱實驗全流程詳解

介紹動手實驗:通過 Azure DevOps 沙箱環境實操,體驗從代碼提交到測試篩選的全流程。如何快速掌握,以及在實際工作中如何運用。 通過 Azure DevOps 沙箱環境進行動手實驗,是快速掌握 DevOps 全流程(從代碼提交到測試篩選…

VulnHub-DC-2靶機

主機發現 sudo arp-scan -l 以sudo管理員權限掃描本地活動ip地址 Interface: eth0, type: EN10MB, MAC: 08:00:27:22:46:4f, IPv4: 192.168.252.230 Starting arp-scan 1.10.0 with 256 hosts (https://github.com/royhills/arp-scan) 192.168.252.6 4c:5f:70:74:3c:3b …

藏語英語中文機器翻譯入門實踐

🎯 項目目標: 輸入藏文句子,自動翻譯成英文和中文(或輸入中文,翻譯為英文和藏文)。 🔍 技術與原理簡介 機器翻譯(Machine Translation, MT)是人工智能中自然語言處理&a…

【阿里云大模型高級工程師ACP習題集】2.9 大模型應用生產實踐(上篇)

練習題 【單選題】在自然語言處理的法務咨詢場景中,以下哪種模型選擇最為合適? A. 通用大語言模型 B. 經過數學領域微調的模型 C. 面向法律領域訓練的模型 D. 視覺模型 【多選題】以下哪些屬于模型非功能性需求?( ) A. 模型對不同語言的支持能力 B. 模型的響應速度要求 C.…

WPF之ProgressBar控件詳解

文章目錄 1. ProgressBar控件簡介2. ProgressBar的基本屬性和用法2.1 基本屬性2.2 基本用法2.3 代碼中修改進度 3. 確定與不確定模式3.1 確定模式(Determinate)3.2 不確定模式(Indeterminate) 4. 在多線程環境中更新ProgressBar4.…

IntelliJ IDEA 保姆級安裝教程(附安裝包)

文章目錄 一、下載二、安裝三、啟動 一、下載 Ultimate 2021.1.1 - Windows x64 (exe) 二、安裝 三、啟動 首次安裝啟動 非首次安裝啟動

Performance API 性能上報

以下是關于 Performance API 性能上報的基本知識點總結: 一、性能監控核心指標體系 1. 關鍵性能指標(Web Vitals) 指標標準采集方式健康閾值LCP (最大內容繪制)測量加載性能PerformanceObserver≤2.5sFID (首次輸入延遲)測量交互響應PerformanceObserver≤100msCLS (累積布…

C語言-指針(一)

目錄 指針 內存 概念 指針變量 取地址操作符(&) 操作符“ * ” 指針變量的大小 注意 指針類型的意義 作用 void * 指針 const修飾指針變量 const放在*前 const放在*后 雙重const修飾 指針的運算 1.指針 - 整數 2.指針 - 指針 3.指…

華為云Astro大屏連接器創建操作實例:抽取物聯網iotda影子設備數據的連接器創建

目錄 樣圖(API連接器創建成功) 說明 操作場景(以Astro大屏抽取iotda影子參數為例) 實際操作步驟 新建連接器 設置基本信息。 接口鑒權方式,支持API鑒權、AK/SK、API Key和無身份驗證 無身份驗證 AK/SK認證(目前暫不能用) API Key認證(第三方使用) API鑒權認…

【硬件系統架構】哈佛架構

一、引言 在計算機科學的浩瀚宇宙中,計算機體系結構猶如星辰般繁多且各有獨特光芒。哈佛架構便是其中一顆耀眼的明星,它在眾多計算機體系結構中占據著獨特而重要的地位。從計算機技術的萌芽期一路走來,哈佛架構不斷發展演變,在不同…

華為eNSP:IS-IS認證

一、什么是IS-IS認證? 華為eNSP中的IS-IS認證 IS-IS認證是華為eNSP網絡中用于保障中間系統到中間系統(IS-IS)協議通信安全性的核心機制,通過身份驗證和數據完整性校驗防止非法路由信息注入或篡改。其實現方式與關鍵特性如下&…

如何創建并使用極狐GitLab 項目訪問令牌?

極狐GitLab 是 GitLab 在中國的發行版,關于中文參考文檔和資料有: 極狐GitLab 中文文檔極狐GitLab 中文論壇極狐GitLab 官網 項目訪問令牌 在極狐GitLab 16.1中引入添加了默認前綴。 項目訪問令牌類似于密碼,但你可以 限制訪問資源&#xf…

C# 異步詳解

C# 異步編程詳解 一、異步編程基礎概念 1. 同步 vs 異步 ??同步(Synchronous)??:任務按順序執行,前一個任務完成后才會執行下一個??異步(Asynchronous)??:任務可以非阻塞地啟動,主線程可以繼續執行其他操作 2. 異步編…

C++ 之 【模擬實現 list(節點、迭代器、常見接口)】(將三個模板放在同一個命名空間就實現 list 啦)

1.前提準備 (1) list 的底層結構一般是帶頭雙向循環鏈表 (1)為避免命名沖突&#xff0c;需要創建一個命名空間來存放模擬實現的 list (2)下面模擬實現list時&#xff0c;聲明和定義不分離(具體原因后續講解) 2.完整實現 2.1 鏈表節點 template<class T>//節點寫成類模板…