LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略
目錄
相關文章
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀
LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略
OpenAI o3-mini的簡介
1、特點
2、性能表現
>> 競賽數學 (AIME 2024):o3-mini (高推理強度)達到83.6%的準確率
>> 博士級科學問題 (GPQA Diamond):o3-mini (高推理強度)達到77.0%的準確率
3、模型速度和性能
4、安全性
5、未來展望
OpenAI o3-mini的安裝和使用方法
1、安裝
2、使用方法
ChatGPT
API
OpenAI o3-mini的案例應用
相關文章
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀-CSDN博客
LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略
LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略-CSDN博客
OpenAI o3-mini的簡介
OpenAI o3-mini是OpenAI發布的最新推理模型,也是該系列中最經濟高效的模型。它于2024年12月預覽,現已在ChatGPT和API中可用。o3-mini是一個強大且快速的模型,它突破了小型模型的性能限制,在科學、數學和編碼等STEM領域展現出卓越的能力,同時保持了與OpenAI o1-mini相同的低成本和低延遲。
o3-mini是第一個支持函數調用、結構化輸出和開發者消息的小型推理模型,使其具備生產就緒能力。它支持流式輸出,并提供低、中、高三種推理強度選項,以適應不同的使用場景。 o3-mini作為一款經濟高效、功能強大的推理模型,已在多種平臺和API中推出,并對不同用戶群體開放,極大提升了AI技術的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上線,企業版將于2月上線。API方面,o3-mini已開始向API使用等級3-5的開發者推出。免費用戶也可以在ChatGPT中使用o3-mini。
總而言之,OpenAI o3-mini 是一款在保持低成本和低延遲的同時,擁有強大STEM能力,尤其在科學、數學和編碼方面表現出色的推理模型。它支持多種開發者功能,并提供了多種推理強度選項,以適應不同的使用場景。在多個基準測試中,o3-mini 的性能超越了其前代模型,并且在安全性方面也進行了充分的考量。o3-mini 的發布標志著 OpenAI 在經濟高效人工智能領域取得了重要進展,也為更廣泛的 AI 應用鋪平了道路。
官網文章:https://openai.com/index/openai-o3-mini/
1、特點
>> 高性價比:o3-mini在保持低成本和低延遲的同時,提供了強大的推理能力。
>> 強大的STEM能力:在科學、數學和編碼方面表現出色,尤其在解決復雜問題方面能力突出。
>> 豐富的開發者功能:支持函數調用、結構化輸出和開發者消息,方便開發者集成到各種應用中。
>> 可調節的推理強度:提供低、中、高三種推理強度選項,允許開發者根據具體應用場景調整模型的推理深度和速度。
>> 快速響應:平均響應時間比o1-mini快24%,首次token生成時間快2500毫秒。
>> 更高的準確性:專家測試顯示,o3-mini的答案更準確、更清晰,推理能力更強,錯誤率降低了39%。
>> 支持搜索:可以結合搜索引擎查找最新的信息,并提供相關鏈接(目前為早期原型)。
>> 安全性:采用審慎對齊技術進行訓練,在安全性和防越獄評估中表現優異。
2、性能表現
o3-mini在STEM領域表現出色,尤其在數學、編碼和科學方面,其性能與OpenAI o1相當甚至超越,同時響應速度更快,錯誤率更低。o3-mini在各種STEM相關的基準測試和人類偏好測試中均表現優異,證明了其在準確性、速度和推理能力方面的優勢。
在多個基準測試中,o3-mini均取得了優異的成績,包括:
>> 競賽數學 (AIME 2024):o3-mini (高推理強度)達到83.6%的準確率
>> 博士級科學問題 (GPQA Diamond):o3-mini (高推理強度)達到77.0%的準確率
>> FrontierMath:o3-mini (高推理強度)在首次嘗試時解決了超過32%的問題。
>> 競賽編碼 (Codeforces):o3-mini在不同推理強度下均優于o1-mini。
>> 軟件工程 (SWE-bench Verified):o3-mini是目前在SWEbench-verified上表現最佳的模型。
>> LiveBench 編碼:o3-mini在中、高推理強度下均優于o1-high。
>> 一般知識:o3-mini在一般知識評估中優于o1-mini。
在人類偏好評估中,測試者更傾向于o3-mini的回答 (56%),并且錯誤率降低了39%。o3-mini的響應速度比o1-mini快24%。
3、模型速度和性能
o3-mini在保持與OpenAI o1相當的智能水平的同時,實現了更快的性能和更高的效率。o3-mini在速度和效率方面顯著優于其前代模型,這使其更適合需要快速響應的應用場景。
o3-mini的平均響應時間為7.7秒,比o1-mini的10.16秒快24%。它在首次生成token的時間上也比o1-mini快2500毫秒。
4、安全性
OpenAI 采取了嚴格的安全措施來確保 o3-mini 的安全性和可靠性。OpenAI 使用審慎對齊技術訓練 o3-mini,使其能夠安全地響應用戶提示。o3-mini在安全性和防越獄評估中顯著優于GPT-4o。
在部署之前,OpenAI 對 o3-mini 進行了全面的安全評估,包括外部紅隊測試和安全評估。詳細的評估結果可在 o3-mini 系統卡片中查看。
5、未來展望
OpenAI 將繼續努力降低 AI 成本,并提升 AI 的性能和安全性。OpenAI 將繼續致力于開發平衡智能、效率和安全性的模型。OpenAI o3-mini 的發布是 OpenAI 持續推進經濟高效人工智能發展的重要一步,它使得高質量的 AI 更加易于獲取。
OpenAI o3-mini的安裝和使用方法
1、安裝
OpenAI o3-mini 目前并未開源,不支持本地部署。用戶只能通過在線方式(例如在ChatGPT中使用)或調用OpenAI提供的API來使用該模型。
2、使用方法
ChatGPT
ChatGPT Plus、Team和Pro用戶可以直接在模型選擇器中選擇o3-mini使用。免費用戶可以通過選擇“Reason”或重新生成回復來使用o3-mini。
付費用戶 (Plus, Team, Pro):直接在ChatGPT的模型選擇器中選擇 o3-mini 即可使用。
免費用戶:可以通過兩種方式使用:在消息輸入框中選擇 "Reason"。重新生成已有的回復。
API
o3-mini已開始在Chat Completions API、Assistants API和Batch API中向特定等級的開發者推出。 具體使用方法取決于你選擇的 API,請參考 OpenAI 的 API 文檔。開發者可以根據需求選擇三種推理強度:低、中、高。 高強度推理會更準確,但響應速度較慢;低強度推理速度更快,但準確性可能略低。 中等強度則在速度和準確性之間取得平衡。
API地址:https://platform.openai.com/docs/models#current-model-aliases
from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="o3-mini",messages=[{"role": "developer", "content": "You are a helpful assistant."},{"role": "user","content": "Write a haiku about recursion in programming."}]
)print(completion.choices[0].message)
OpenAI o3-mini的案例應用
持續更新中……