LLMs之OpenAI o系列：OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略

LLMs之o3：《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀

OpenAI o3-mini的簡介

1、特點

2、性能表現

>> 競賽數學 (AIME 2024)：o3-mini (高推理強度)達到83.6%的準確率

>> 博士級科學問題 (GPQA Diamond)：o3-mini (高推理強度)達到77.0%的準確率

3、模型速度和性能

4、安全性

5、未來展望

OpenAI o3-mini的安裝和使用方法

1、安裝

2、使用方法

ChatGPT

API

OpenAI o3-mini的案例應用

LLMs之o3：《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀

LLMs之o3：《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀-CSDN博客

LLMs之OpenAI o系列：OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略

LLMs之OpenAI o系列：OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略-CSDN博客

OpenAI o3-mini的簡介

OpenAI o3-mini是OpenAI發布的最新推理模型，也是該系列中最經濟高效的模型。它于2024年12月預覽，現已在ChatGPT和API中可用。o3-mini是一個強大且快速的模型，它突破了小型模型的性能限制，在科學、數學和編碼等STEM領域展現出卓越的能力，同時保持了與OpenAI o1-mini相同的低成本和低延遲。

o3-mini是第一個支持函數調用、結構化輸出和開發者消息的小型推理模型，使其具備生產就緒能力。它支持流式輸出，并提供低、中、高三種推理強度選項，以適應不同的使用場景。 o3-mini作為一款經濟高效、功能強大的推理模型，已在多種平臺和API中推出，并對不同用戶群體開放，極大提升了AI技術的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上線，企業版將于2月上線。API方面，o3-mini已開始向API使用等級3-5的開發者推出。免費用戶也可以在ChatGPT中使用o3-mini。

總而言之，OpenAI o3-mini 是一款在保持低成本和低延遲的同時，擁有強大STEM能力，尤其在科學、數學和編碼方面表現出色的推理模型。它支持多種開發者功能，并提供了多種推理強度選項，以適應不同的使用場景。在多個基準測試中，o3-mini 的性能超越了其前代模型，并且在安全性方面也進行了充分的考量。o3-mini 的發布標志著 OpenAI 在經濟高效人工智能領域取得了重要進展，也為更廣泛的 AI 應用鋪平了道路。

官網文章：https://openai.com/index/openai-o3-mini/

1、特點

>> 高性價比：o3-mini在保持低成本和低延遲的同時，提供了強大的推理能力。
>> 強大的STEM能力：在科學、數學和編碼方面表現出色，尤其在解決復雜問題方面能力突出。
>> 豐富的開發者功能：支持函數調用、結構化輸出和開發者消息，方便開發者集成到各種應用中。
>> 可調節的推理強度：提供低、中、高三種推理強度選項，允許開發者根據具體應用場景調整模型的推理深度和速度。
>> 快速響應：平均響應時間比o1-mini快24%，首次token生成時間快2500毫秒。
>> 更高的準確性：專家測試顯示，o3-mini的答案更準確、更清晰，推理能力更強，錯誤率降低了39%。
>> 支持搜索：可以結合搜索引擎查找最新的信息，并提供相關鏈接（目前為早期原型）。
>> 安全性：采用審慎對齊技術進行訓練，在安全性和防越獄評估中表現優異。

2、性能表現

o3-mini在STEM領域表現出色，尤其在數學、編碼和科學方面，其性能與OpenAI o1相當甚至超越，同時響應速度更快，錯誤率更低。o3-mini在各種STEM相關的基準測試和人類偏好測試中均表現優異，證明了其在準確性、速度和推理能力方面的優勢。

在多個基準測試中，o3-mini均取得了優異的成績，包括：

>> 競賽數學 (AIME 2024)：o3-mini (高推理強度)達到83.6%的準確率

>> 博士級科學問題 (GPQA Diamond)：o3-mini (高推理強度)達到77.0%的準確率

>> FrontierMath：o3-mini (高推理強度)在首次嘗試時解決了超過32%的問題。

>> 競賽編碼 (Codeforces)：o3-mini在不同推理強度下均優于o1-mini。

>> 軟件工程 (SWE-bench Verified)：o3-mini是目前在SWEbench-verified上表現最佳的模型。

>> LiveBench 編碼：o3-mini在中、高推理強度下均優于o1-high。

>> 一般知識：o3-mini在一般知識評估中優于o1-mini。

在人類偏好評估中，測試者更傾向于o3-mini的回答 (56%)，并且錯誤率降低了39%。o3-mini的響應速度比o1-mini快24%。

3、模型速度和性能

o3-mini在保持與OpenAI o1相當的智能水平的同時，實現了更快的性能和更高的效率。o3-mini在速度和效率方面顯著優于其前代模型，這使其更適合需要快速響應的應用場景。

o3-mini的平均響應時間為7.7秒，比o1-mini的10.16秒快24%。它在首次生成token的時間上也比o1-mini快2500毫秒。

4、安全性

OpenAI 采取了嚴格的安全措施來確保 o3-mini 的安全性和可靠性。OpenAI 使用審慎對齊技術訓練 o3-mini，使其能夠安全地響應用戶提示。o3-mini在安全性和防越獄評估中顯著優于GPT-4o。

在部署之前，OpenAI 對 o3-mini 進行了全面的安全評估，包括外部紅隊測試和安全評估。詳細的評估結果可在 o3-mini 系統卡片中查看。

5、未來展望

OpenAI 將繼續努力降低 AI 成本，并提升 AI 的性能和安全性。OpenAI 將繼續致力于開發平衡智能、效率和安全性的模型。OpenAI o3-mini 的發布是 OpenAI 持續推進經濟高效人工智能發展的重要一步，它使得高質量的 AI 更加易于獲取。

OpenAI o3-mini的安裝和使用方法

1、安裝

OpenAI o3-mini 目前并未開源，不支持本地部署。用戶只能通過在線方式（例如在ChatGPT中使用）或調用OpenAI提供的API來使用該模型。

2、使用方法

ChatGPT

ChatGPT Plus、Team和Pro用戶可以直接在模型選擇器中選擇o3-mini使用。免費用戶可以通過選擇“Reason”或重新生成回復來使用o3-mini。

付費用戶 (Plus, Team, Pro)：直接在ChatGPT的模型選擇器中選擇 o3-mini 即可使用。

免費用戶：可以通過兩種方式使用：在消息輸入框中選擇 "Reason"。重新生成已有的回復。

API

o3-mini已開始在Chat Completions API、Assistants API和Batch API中向特定等級的開發者推出。具體使用方法取決于你選擇的 API，請參考 OpenAI 的 API 文檔。開發者可以根據需求選擇三種推理強度：低、中、高。高強度推理會更準確，但響應速度較慢；低強度推理速度更快，但準確性可能略低。中等強度則在速度和準確性之間取得平衡。
API地址：https://platform.openai.com/docs/models#current-model-aliases

from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="o3-mini",messages=[{"role": "developer", "content": "You are a helpful assistant."},{"role": "user","content": "Write a haiku about recursion in programming."}]
)print(completion.choices[0].message)

OpenAI o3-mini的案例應用

持續更新中……

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/894406.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/894406.shtml
英文地址，請注明出處：http://en.pswp.cn/news/894406.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！