GPT-4.5 怎么樣?如何升級使用ChatGPTPlus/Pro? GPT-4.5設計目標是成為一款非推理型模型的巔峰之作
今天我們來說說上午發布的GPT-4.5,接下來我們說說GPT4.5到底如何,有哪些功能?有哪些性能提升?怎么快速使用到GPT-4.5?同時給大家介紹一下如何升級ChatGPT?
OpenAI 正式發布 GPT-4.5 研究預覽版
這是目前最大、最先進的 GPT 模型。該模型在無監督學習(unsupervised learning)和推理能力(reasoning)上取得了重大進步,并優化了人機交互體驗,減少了幻覺現象(hallucination)。
GPT-4.5 的設計目標是成為一款非推理型(non-reasoning)模型的巔峰之作,同時為未來的技術路線(如 GPT-5)鋪路。它在多個領域表現出色,包括寫作、編程和實際問題解決,同時顯著減少了“幻覺”(hallucination,即生成不準確或虛構內容)的發生。
GPT-4.5 目前提供給 ChatGPT Pro 用戶和開發者,并計劃逐步推廣至其他用戶群體。
下周:ChatGPT?Plus 和 Team 版?用戶即可使用 GPT-4.5,
再后一周:企業版(Enterprise)和教育版(Edu)?用戶可使用。
插播一下有童鞋需要升級訂閱的怎么做
PS:筆者已經在鏡像站體驗了一波:
如何訂閱升級ChatGPT
很多童鞋還是想要自行升級ChatGPT的可以參考本教程:(最新)國內如何訂閱升級購買ChatGPT Pro Plus會員教程 - AI is all your need!
說回正題,然而,它并非革命性升級,也沒有超越推理模型在特定領域的表現。GPT-4.5 發布后,一些人表示了失望,對于用戶而言,GPT-4.5 提供了一個更智能、更可靠的聊天體驗,但其高昂的成本和部分功能缺失也引發了一些討論。
GPT-4.5模型現狀:
-
API 預覽版已開放:
-
支持文件和圖像輸入
-
支持函數調用、結構化輸出、流式響應
-
不支持語音模式、視頻、屏幕共享(未來可能增加)
同時GPT-4.5 在部分基準測試上不如 Claude 3.5 ,甚至不如 Deepseek V3。
但是奧特曼對此有自己的說法,OpenAI 首席執行官 Sam Altman 表示,GPT-4.5 是其“最后一代非推理模型”,未來產品將整合更多技術(如推理能力)。
“這不是一個推理模型,也不會打破任何基準。這是一種不同的智能,我從未體驗過這樣的魔力。真的很期待大家來嘗試!”
根據OpenAI官方的介紹,GPT?4.5 是一個非常龐大且計算密集的模型,訓練時使用了比以往更多的計算資源和數據,訓練的計算量可能是GPT4 的10倍。
GPT?4.5 是一個通過提升計算能力和數據規模,以及架構和優化創新,來擴展無監督學習的例子。GPT?4.5 在微軟 Azure AI 超級計算機上進行訓練,最終形成了一個知識面更廣、對世界理解更深的模型,從而減少了幻覺現象,并在多個主題上提供了更高的可靠性。
GPT 4.5主要特點
-
規模與知識深度: ? GPT-4.5 是 OpenAI 有史以來最大的模型,訓練時使用了比以往更多的計算資源和數據。 ? 與 GPT-4o 相比,其“世界知識”(world knowledge)更深,覆蓋范圍更廣,能夠理解更復雜的背景和語境。 ? OpenAI 表示,模型規模的提升使其更少需要“憑空捏造”答案,幻覺現象顯著減少。
-
情感智能與對話自然性: ? GPT-4.5 在“情感直覺”(emotional intelligence)方面有所突破,能夠更好地捕捉人類意圖和情緒。 ? 用戶反饋顯示,與 GPT-4o 相比,GPT-4.5 的對話更自然,尤其在日常查詢、專業任務和創意寫作(如詩歌創作)中表現更優。
3. 通用性設計: ? 與 OpenAI 的“o系列”(如 o1、o3-mini)推理模型不同,GPT-4.5 并非專注于數學或科學推理,而是定位為通用型模型。 ? 它適用于廣泛的應用場景,包括寫作、編程、問題解決等。
4. 功能支持: ? 支持實時網頁搜索、文件和圖像上傳,以及 ChatGPT 的 Canvas 工具。 ? 暫不支持語音模式(Voice Mode)、視頻或屏幕共享功能。
性能表現
OpenAI 提供了多項基準測試數據,以展示 GPT-4.5 的能力:
-
SimpleQA 測試(OpenAI 開發的一個常識性問答基準):
-
GPT-4.5 得分 62.5%,顯著高于 GPT-4o 的 38.6% 和 o3-mini 的 15%。
-
幻覺率:GPT-4.5 為 37.1%,低于 GPT-4o 的 59.8% 和 o3-mini 的 80.3%。
-
MMLU 測試(語言理解基準): ? 與 GPT-4o 相比提升有限,但在語言任務中略有優勢。 ? 數學與科學測試: ? GPT-4.5 在這些領域的表現不如 o3-mini 等推理模型,表明其并非專注于 STEM(科學、技術、工程、數學)任務。
研究人員指出,基準測試無法完全反映 GPT-4.5 的實際體驗。用戶可能在寫作、編程等非量化任務中感受到更顯著的進步。
與前代模型的對比
-
與 GPT-4o 的差異: ? GPT-4.5 在預訓練階段投入了更多資源,規模相當于從 GPT-3.5 到 GPT-4o 的跳躍。 ? 它減少了幻覺,提升了寫作能力和對話流暢性,但未引入突破性的新功能。
-
與推理模型(o1、o3)的區別: ? o系列模型擅長逐步推理(chain-of-thought),適合數學和科學問題。 ? GPT-4.5 則更注重即時響應和通用性,不以推理為核心。
OpenAI 首席執行官 Sam Altman 表示,GPT-4.5 是其“最后一代非推理模型”,未來產品將整合更多技術(如推理能力)。
最后:
筆者的一點唏噓,GPT-4.5 是其“最后一代非推理模型”,AI早就有了自己的思緒,但是我們的思想卻再被慢慢剝奪,所以,讓我們慢一點也行,工具該有還是必須用,但是務必請保持一份自我的思考。
官方介紹:https://openai.com/index/introducing-gpt-4-5/