LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略

LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略

目錄

相關文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀

LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略

OpenAI o3-mini的簡介

1、特點

2、性能表現

>> 競賽數學 (AIME 2024):o3-mini (高推理強度)達到83.6%的準確率

>> 博士級科學問題 (GPQA Diamond):o3-mini (高推理強度)達到77.0%的準確率

3、模型速度和性能

4、安全性

5、未來展望

OpenAI o3-mini的安裝和使用方法

1、安裝

2、使用方法

ChatGPT

API

OpenAI o3-mini的案例應用


相關文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻譯與解讀-CSDN博客

LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略

LLMs之OpenAI o系列:OpenAI o3-mini的簡介、安裝和使用方法、案例應用之詳細攻略-CSDN博客

OpenAI o3-mini的簡介

OpenAI o3-mini是OpenAI發布的最新推理模型,也是該系列中最經濟高效的模型。它于2024年12月預覽,現已在ChatGPT和API中可用。o3-mini是一個強大且快速的模型,它突破了小型模型的性能限制,在科學、數學和編碼等STEM領域展現出卓越的能力,同時保持了與OpenAI o1-mini相同的低成本和低延遲。

o3-mini是第一個支持函數調用結構化輸出開發者消息小型推理模型,使其具備生產就緒能力。它支持流式輸出,并提供低、中、高三種推理強度選項,以適應不同的使用場景。 o3-mini作為一款經濟高效、功能強大的推理模型,已在多種平臺和API中推出,并對不同用戶群體開放,極大提升了AI技術的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上線,企業版將于2月上線。API方面,o3-mini已開始向API使用等級3-5的開發者推出。免費用戶也可以在ChatGPT中使用o3-mini。

總而言之,OpenAI o3-mini 是一款在保持低成本低延遲的同時,擁有強大STEM能力,尤其在科學、數學和編碼方面表現出色的推理模型。它支持多種開發者功能,并提供了多種推理強度選項,以適應不同的使用場景。在多個基準測試中,o3-mini 的性能超越了其前代模型,并且在安全性方面也進行了充分的考量。o3-mini 的發布標志著 OpenAI 在經濟高效人工智能領域取得了重要進展,也為更廣泛的 AI 應用鋪平了道路。

官網文章:https://openai.com/index/openai-o3-mini/

1、特點

>> 高性價比:o3-mini在保持低成本和低延遲的同時,提供了強大的推理能力。
>> 強大的STEM能力:在科學、數學和編碼方面表現出色,尤其在解決復雜問題方面能力突出。
>> 豐富的開發者功能:支持函數調用、結構化輸出和開發者消息,方便開發者集成到各種應用中。
>> 可調節的推理強度:提供低、中、高三種推理強度選項,允許開發者根據具體應用場景調整模型的推理深度和速度。
>> 快速響應:平均響應時間比o1-mini快24%,首次token生成時間快2500毫秒。
>> 更高的準確性:專家測試顯示,o3-mini的答案更準確、更清晰,推理能力更強,錯誤率降低了39%。
>> 支持搜索:可以結合搜索引擎查找最新的信息,并提供相關鏈接(目前為早期原型)。
>> 安全性:采用審慎對齊技術進行訓練,在安全性和防越獄評估中表現優異。

2、性能表現

o3-mini在STEM領域表現出色,尤其在數學、編碼和科學方面,其性能與OpenAI o1相當甚至超越,同時響應速度更快,錯誤率更低。o3-mini在各種STEM相關的基準測試和人類偏好測試中均表現優異,證明了其在準確性、速度和推理能力方面的優勢。

在多個基準測試中,o3-mini均取得了優異的成績,包括:

>> 競賽數學 (AIME 2024):o3-mini (高推理強度)達到83.6%的準確率

>> 博士級科學問題 (GPQA Diamond):o3-mini (高推理強度)達到77.0%的準確率

>> FrontierMath:o3-mini (高推理強度)在首次嘗試時解決了超過32%的問題。

>> 競賽編碼 (Codeforces):o3-mini在不同推理強度下均優于o1-mini。

>> 軟件工程 (SWE-bench Verified):o3-mini是目前在SWEbench-verified上表現最佳的模型。

>> LiveBench 編碼:o3-mini在中、高推理強度下均優于o1-high。

>> 一般知識:o3-mini在一般知識評估中優于o1-mini。

在人類偏好評估中,測試者更傾向于o3-mini的回答 (56%),并且錯誤率降低了39%。o3-mini的響應速度比o1-mini快24%。

3、模型速度和性能

o3-mini在保持與OpenAI o1相當的智能水平的同時,實現了更快的性能和更高的效率。o3-mini在速度和效率方面顯著優于其前代模型,這使其更適合需要快速響應的應用場景。

o3-mini的平均響應時間為7.7秒,比o1-mini的10.16秒快24%。它在首次生成token的時間上也比o1-mini快2500毫秒。

4、安全性

OpenAI 采取了嚴格的安全措施來確保 o3-mini 的安全性和可靠性。OpenAI 使用審慎對齊技術訓練 o3-mini,使其能夠安全地響應用戶提示。o3-mini在安全性和防越獄評估中顯著優于GPT-4o。

在部署之前,OpenAI 對 o3-mini 進行了全面的安全評估,包括外部紅隊測試和安全評估。詳細的評估結果可在 o3-mini 系統卡片中查看。

5、未來展望

OpenAI 將繼續努力降低 AI 成本,并提升 AI 的性能和安全性。OpenAI 將繼續致力于開發平衡智能、效率和安全性的模型。OpenAI o3-mini 的發布是 OpenAI 持續推進經濟高效人工智能發展的重要一步,它使得高質量的 AI 更加易于獲取。

OpenAI o3-mini的安裝和使用方法

1、安裝

OpenAI o3-mini 目前并未開源,不支持本地部署。用戶只能通過在線方式(例如在ChatGPT中使用)或調用OpenAI提供的API來使用該模型。

2、使用方法

ChatGPT

ChatGPT Plus、Team和Pro用戶可以直接在模型選擇器中選擇o3-mini使用。免費用戶可以通過選擇“Reason”或重新生成回復來使用o3-mini。

付費用戶 (Plus, Team, Pro):直接在ChatGPT的模型選擇器中選擇 o3-mini 即可使用。

免費用戶:可以通過兩種方式使用:在消息輸入框中選擇 "Reason"。重新生成已有的回復。

API

o3-mini已開始在Chat Completions API、Assistants API和Batch API中向特定等級的開發者推出。 具體使用方法取決于你選擇的 API,請參考 OpenAI 的 API 文檔。開發者可以根據需求選擇三種推理強度:低、中、高。 高強度推理會更準確,但響應速度較慢;低強度推理速度更快,但準確性可能略低。 中等強度則在速度和準確性之間取得平衡。
API地址:https://platform.openai.com/docs/models#current-model-aliases

from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="o3-mini",messages=[{"role": "developer", "content": "You are a helpful assistant."},{"role": "user","content": "Write a haiku about recursion in programming."}]
)print(completion.choices[0].message)

OpenAI o3-mini的案例應用

持續更新中……

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/894406.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/894406.shtml
英文地址,請注明出處:http://en.pswp.cn/news/894406.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

女生年薪12萬,算不算屬于高收入人群

在繁華喧囂的都市中,我們時常會聽到關于收入、高薪與生活質量等話題的討論。尤其是對于年輕女性而言,薪資水平不僅關乎個人價值的體現,更直接影響到生活質量與未來的規劃。那么,女生年薪12萬,是否可以被劃入高收入人群…

AI開發學習之——PyTorch框架

PyTorch 簡介 PyTorch (Python torch)是由 Facebook AI 研究團隊開發的開源機器學習庫,廣泛應用于深度學習研究和生產。它以動態計算圖和易用性著稱,支持 GPU 加速計算,并提供豐富的工具和模塊。 PyTorch的主要特點 …

Python安居客二手小區數據爬取(2025年)

目錄 2025年安居客二手小區數據爬取觀察目標網頁觀察詳情頁數據準備工作:安裝裝備就像打游戲代碼詳解:每行代碼都是你的小兵完整代碼大放送爬取結果 2025年安居客二手小區數據爬取 這段時間需要爬取安居客二手小區數據,看了一下相關教程基本…

OpenCV:開運算

目錄 1. 簡述 2. 用腐蝕和膨脹實現開運算 2.1 代碼示例 2.2 運行結果 3. 開運算接口 3.1 參數詳解 3.2 代碼示例 3.3 運行結果 4. 開運算應用場景 5. 注意事項 6. 總結 相關閱讀 OpenCV:圖像的腐蝕與膨脹-CSDN博客 OpenCV:閉運算-CSDN博客 …

JavaWeb入門-請求響應(Day3)

(一)請求響應概述 請求(HttpServletRequest):獲取請求數據 響應(HttpServletResponse):設置響應數據 BS架構:Browser/Server,瀏覽器/服務器架構模式。客戶端只需要瀏覽器就可訪問,應用程序的邏輯和數據都存儲在服務端(維護方便,響應速度一般) CS架構:Client/ser…

【SLAM】于AutoDL云上GPU運行GCNv2_SLAM的記錄

配置GCNv2_SLAM所需環境并實現AutoDL云端運行項目的全過程記錄。 本文首發于?慕雪的寒舍 1. 引子 前幾天寫了一篇在本地虛擬機里面CPU運行GCNv2_SLAM項目的博客:鏈接,關于GCNv2_SLAM項目相關的介紹請移步此文章,本文不再重復說明。 GCNv2:…

羅格斯大學:通過輸入嵌入對齊選擇agent

📖標題:AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback 🌐來源:arXiv, 2501.13333 🌟摘要 🔸多代理系統必須決定哪個代理最適合給定的任務。我們提出了一種新的架…

【實戰篇】Android安卓本地離線實現視頻檢測人臉

實戰篇Android安卓本地離線實現視頻檢測人臉 引言項目概述核心代碼類介紹人臉檢測流程項目地址總結 引言 在當今數字化時代,人臉識別技術已經廣泛應用于各個領域,如安防監控、門禁系統、移動支付等。本文將以第三視角詳細講解如何基于bifan-wei-Face/De…

團體程序設計天梯賽-練習集——L1-025 正整數A+B

一年之際在于春,新年的第一天,大家敲代碼了嗎?哈哈 前言 這道題分值是15分,值這個分,有一小點運算,難度不大,雖然說做出來了,但是有兩個小疑點。 L1-025 正整數AB 題的目標很簡單…

Leetcode:598

1,題目 2,思路 腦筋急轉彎,看題目一時半會還沒搞懂意思。 其實不然就是說ops是個矩陣集合,集合的每個矩陣有倆個元素理解為行列邊距 m和n是理解為一個主矩陣,計算ops的每個小矩陣還有這個主矩陣的交集返回面積 3&…

web前端12--表單和表格

1、表格標簽 使用<table>標簽來定義表格 HTML 中的表格和Excel中的表格是類似的&#xff0c;都包括行、列、單元格、表頭等元素。 區別&#xff1a;HTML表格在功能方面遠沒有Excel表格強大&#xff0c;HTML表格不支持排序、求和、方差等數學計算&#xff0c;主要用于布…

為何 git 默認是 master分支,而github默認是main分支(DeepSeek問答)

為何 git 默認是 master分支&#xff0c;而github默認是main分支 Git 和 GitHub 在默認分支名稱上的差異源于歷史背景和社會因素的變化。 Git 的 master 分支 歷史原因&#xff1a;Git 由 Linus Torvalds 于 2005 年創建&#xff0c;最初使用 master 作為默認分支名稱&#x…

【AI】探索自然語言處理(NLP):從基礎到前沿技術及代碼實踐

Hi &#xff01; 云邊有個稻草人-CSDN博客 必須有為成功付出代價的決心&#xff0c;然后想辦法付出這個代價。 目錄 引言 1. 什么是自然語言處理&#xff08;NLP&#xff09;&#xff1f; 2. NLP的基礎技術 2.1 詞袋模型&#xff08;Bag-of-Words&#xff0c;BoW&#xff…

Java集合+并發(部分)

Java集合 Java集合類的繼承結構和各自的適用情況 Collection ? — List ? — ArrayList&#xff1a;動態數組 ? — LinkedList&#xff1a;底層是雙向鏈表&#xff0c;應用于Queue接口可以用于實現隊列&#xff0c;應用于Deque接口可以用于實現棧 ? — Vector&#x…

第1章 量子暗網中的血色黎明

月球暗面的危機與陰謀 量子隧穿效應催生的幽藍電弧&#xff0c;于環形山表面肆意跳躍&#xff0c;仿若無數奮力掙扎的機械蠕蟲&#xff0c;將月球暗面的死寂打破&#xff0c;徒增幾分詭異。艾麗佇立在被遺棄的“廣寒宮”量子基站頂端&#xff0c;機械義眼之中&#xff0c;倒映著…

AI-ISP論文Learning to See in the Dark解讀

論文地址&#xff1a;Learning to See in the Dark 圖1. 利用卷積網絡進行極微光成像。黑暗的室內環境。相機處的照度小于0.1勒克斯。索尼α7S II傳感器曝光時間為1/30秒。(a) 相機在ISO 8000下拍攝的圖像。(b) 相機在ISO 409600下拍攝的圖像。該圖像存在噪點和色彩偏差。©…

Python3 【高階函數】項目實戰:5 個學習案例

Python3 【高階函數】項目實戰&#xff1a;5 個學習案例 本文包含 5 個關于“高階函數”的綜合應用項目&#xff0c;每個項目都包含完整的程序代碼、測試案例和執行結果。具體項目是&#xff1a; 成績統計分析單詞統計工具簡易計算器工廠任務調度器數據管道處理 項目 1&#…

【Git】初識Git Git基本操作詳解

文章目錄 學習目標Ⅰ. 初始 Git&#x1f4a5;注意事項 Ⅱ. Git 安裝Linux-centos安裝Git Ⅲ. Git基本操作一、創建git本地倉庫 -- git init二、配置 Git -- git config三、認識工作區、暫存區、版本庫① 工作區② 暫存區③ 版本庫④ 三者的關系 四、添加、提交更改、查看提交日…

RK3568使用QT操作LED燈

文章目錄 一、QT中操作硬件設備思路Linux 中的設備文件操作硬件設備的思路1. 打開設備文件2. 寫入數據到設備3. 從設備讀取數據4. 設備控制5. 異常處理在 Qt 中操作設備的典型步驟實際應用中的例子:控制 LED總結二、QT實戰操作LED燈設備1. `mainwindow.h` 頭文件2. `mainwindo…

分布式微服務系統架構第90集:現代化金融核心系統

#1.1 深化數字化轉型&#xff0c;核心面臨新挑戰 1、架構側&#xff1a;無法敏捷協同數字金融經營模式轉型。 2、需求側&#xff1a;業務需求傳導低效始終困擾金融機構。 3、開發側&#xff1a;創新產品上市速度低于期望。 4、運維側&#xff1a;傳統面向資源型監控體系難以支撐…