Qwen一直在默默地接連推出新模型。
每個模型都配備了如此強大的功能和高度量化的規模,讓人無法忽視。
繼今年的QvQ、Qwen2.5-VL和Qwen2.5-Omni之后,Qwen團隊現在發布了他們最新的模型系列——Qwen3。
這次他們不是發布一個而是發布了八個不同的模型——參數范圍從6億到2350億不等——與OpenAI的o1、Gemini 2.5 Pro、DeepSeek R1等頂級模型展開競爭。
Qwen3模型簡介
Qwen3系列包含8個模型,其中兩個是混合專家(Mixture-of-Expert, MoE)模型,而其他6個是密集模型。下表包含了所有這些模型的詳細信息:
在像Qwen3-235B-A22B和Qwen3-30B-A3B這樣的MoE模型中,網絡的不同部分或"專家"根據各種輸入被激活,使它們高效運行。在像Qwen3-14B這樣的密集模型中,對于每個輸入,網絡的所有部分都會被激活。