一、前言
阿里云最新推出的 Qwen3-8B 大語言模型,作為國內首個集成“快思考”與“慢思考”能力的混合推理模型,憑借其 80 億參數規模及 128K 超長上下文支持,正在重塑 AI 應用邊界。該模型既可通過輕量化“快思考”實現低算力秒級響應,也能在復雜任務中激活深度推理模式,以多步邏輯解決難題,顯著降低綜合成本。
本文將深入探討使用Transformers的pipeline實現非流式和流式輸出。
前置文章:開源模型應用落地-qwen模型小試-Qwen3-8B-快速體驗(一)
二、術語
2.1. Qwen3
通義千問3(Qwen3)是阿里巴巴于2025年4月29日推出的全新一代大語言模型,并采用Apache