微軟周三推出了幾款新的“開放式”人工智能模型,其中功能最強大的模型至少在一個基準測試上可與 OpenAI 的 o3-mini 相媲美。所有新的授權模型——Phi 4 mini reasoning、Phi 4 reasoning 和 Phi 4 reasoning plus——都是“推理”模型,這意味著它們能夠花更多時間對復雜問題的解決方案進行事實核查。
它們擴展了微軟一年前推出的 Phi“小型模型”系列,為在邊緣構建應用程序的 AI 開發者提供了基礎。
Phi 4 mini 推理機基于中國人工智能初創公司 DeepSeek 的 R1 推理模型生成的約 100 萬道綜合數學題進行訓練。微軟表示,Phi 4 mini 推理機的參數規模約為 38 億,專為教育應用而設計,例如輕量級設備上的“嵌入式輔導”。
參數大致對應于模型解決問題的能力,具有更多參數的模型通常比具有較少參數的模型表現更好。
Phi 4 推理模型擁有 140 億個參數,使用“高質量”網絡數據以及 OpenAI 之前提到的 o3-mini 的“精選演示”進行訓練。微軟表示,它最適合數學、科學和編程應用。
至于 Phi 4 Reasoning Plus是微軟先前發布的 Phi-4 模型的改進版,旨在提高特定任務的準確性。微軟聲稱,Phi 4 Reasoning Plus 的性能已接近 R1 模型,而 R1 模型的參數數量顯著增加(6710 億)。該公司的內部基準測試結果還顯示,Phi 4 Reasoning Plus 在數學技能測試 OmniMath 上的表現與 o3-mini 相當。
Phi 4 mini reasoning、Phi 4 reasoning、Phi 4 reasoning plus 已在AI 開發平臺 Hugging Face上線,并附有詳細的技術報告。
微軟在一篇博客文章中寫道:“通過提煉、強化學習和高質量數據,這些新模型在規模和性能之間取得了平衡。它們足夠小,適合低延遲環境,同時又保持著可與更大模型相媲美的強大推理能力。這種融合使得即使是資源有限的設備也能高效地執行復雜的推理任務。”