OpenAI在2月27日發布GPT-4.5的研究預覽版——這是迄今為止OpenAI最強大、最出色的聊天模型。GPT-4.5在擴大預訓練和微調規模方面邁出了重要的一步。通過擴大無監督學習的規模,GPT-4.5提升了識別內容中的模式、建立內容關聯和生成對于內容的見解的能力,但并不具備邏輯推理的能力(也就是think)。
早期測試表明,與GPT-4.5的交互體驗更加自然。它擁有更廣泛的知識庫、更強的用戶意圖理解能力,以及更高的“情商”,使其在改進寫作、編程和解決實際問題等任務上更加實用。同ChatGPT4.5的的幻覺現象也減少了。OpenAI這次將GPT-4.5作為預覽版發布,以便更好地了解其優勢和局限性。OpenAI仍在探索它的能力,并期待看到社區開發者和企業用戶以全新的方式使用它。
擴展性的無監督學習
OpenAI主要通過擴展兩種互補的學習范式來推進AI的能力提升:無監督學習和推理。這兩者代表了AI智能的兩個維度。
無監督學習可以提高模型對世界的認知準確性和直覺能力。像GPT-3.5、GPT-4和GPT-4.5這樣的模型推動了這一范式的發展。而推理能力的擴展則教會模型在回答之前進行思考,并形成一條推理鏈,使其能夠應對復雜的科學或邏輯問題。OpenAI o1和OpenAI o3-mini等模型正是使用了這種方式讓回答更加準確。
而GPT-4.5就是無監督學習擴展的一個例子,它通過增加計算能力和數據規模,以及架構和模型調優上的創新來實現的。GPT-4.5是通過Microsoft Azure AI超級計算機上訓練,最終形成了一款知識內容更廣泛、對世界理解更深入的模型,以此減少了幻覺現象,并在多個主題上表現得更加可靠。以下圖片是GPT4.5的一個提問示例。
下圖則是OpenAI不同版本模型在SimpleQA基準測試中的準確度和幻覺度,衡量了大語言模型對于簡單問題回答的準確性。可以看出ChatGPT4.5性能有很大的提升。
訓練以促進人類協作
隨著模型規模的擴大和模型解決問題能力的增強,那么下一步要做的一個重要的任務就是讓它們更深入地理解人類需求和意圖。針對GPT-4.5,OpenAI開發了全新的可擴展技術,使得能夠利用小模型輸出的數據訓練更大、更強的模型。這些技術提升了GPT-4.5的遵從提示詞響應、對語言的理解能力以及自然對話能力。
ChatGPT4.5結合了對世界的深入理解能力和與人類共同協作提升生產力的能力,使得GPT-4.5能夠在人類溫暖且直觀的對話中自然地整合他們想法,更加契合真實人類協作場景。GPT-4.5能夠更好地理解人類的意圖,并能更細膩地解讀出人們對話下的隱含期望和微妙情感變化,總體來說它的“情商”更高。此外,GPT-4.5在美學鑒賞和創造力生成方面表現更為突出,尤為擅長寫作和設計中的輔助。
從下圖的例子中就可以看出,ChatGPT4.5對用戶問題:“我考試掛科了很難受”的回答,ChatGPT-4.5則更像“人話”,對用戶進行了安慰,而不是機械式的輸出解決辦法。
更強的推理能力即將到來
GPT-4.5在回答問題之前并不會進行推理,因此它的優勢與OpenAI o1等用于推理場景的模型是截然不同的。與OpenAI o1和OpenAI o3-mini相比,GPT-4.5是一個更通用、擁有更多訓練知識的更強的模型。但是推理能力會將成為未來模型的核心能力,同時預訓練和推理這兩種擴展方法是將相輔相成。像GPT-4.5這樣的模型通過預訓練變得更智能、更博學,將為未來基于該模型訓練的推理和AI代理打下強大基礎。
安全性
每一次模型能力的提升,模型安全性和負責任AI的理念也需要隨之對應地提升。GPT-4.5采用了新的監督技術,與傳統的監督微調(SFT)以及基于人類反饋的強化學習(RLHF)方法結合,這些方法也曾用于GPT-4o,OpenAI希望這項工作能為未來更強大的模型的安全方案奠定基礎。
為了驗證這些安全改進,OpenAI通常在部署前按照一個Preparedness Framework(準備度框架)進行了一系列安全測試。他們發現在各項測試評估中顯示,GPT模型架構的擴展促進了模型能力的提升。
如何在ChatGPT中使用GPT-4.5?
目前ChatGPT Pro用戶可以在網頁、移動端和桌面端的模型選擇器中選擇GPT-4.5。目前Plus用戶暫時無法使用,預計3月中旬開始Plus用戶則可以使用,然后在隨后的一周向校園和企業用戶推出。
GPT-4.5可以通過搜索訪問最新網絡上的信息,支持文件和圖片上傳,并可以使用Canvas來處理寫作和代碼。然而GPT-4.5目前不支持ChatGPT中的多模態功能,如語音模式、視頻和屏幕共享。據悉未來這些功能將逐漸上線。
如何在API中使用GPT-4.5
OpenAI還在Chat Completions API、Assistants API和Batch API中向所有付費的開發者提供GPT-4.5的API訪問方式。該模型支持多種功能,如函數調用、結構化輸出、流式傳輸和系統消息。它還支持通過圖片輸入實現視覺能力。
根據開發者的測試,他們會發現GPT-4.5在需要更人類情感識別和創造力的應用中表現出色,比如寫作輔助、溝通、學習、輔導和頭腦風暴。此外應用子啊代理場景下的規劃和執行方面也表現強勁,包括多步編碼工作流和復雜任務自動化。
GPT-4.5是一個非常龐大且計算密集型的模型,因此它比GPT-4o更昂貴,并且不會取代GPT-4o。因此,我們正在評估是否要在API中長期提供它,同時在支持當前功能和構建未來模型之間進行平衡。我們期待更多地了解它在現實世界中的優勢、能力和潛在應用。如果GPT-4.5對大家的使用場景提供了獨特價值,大家的反饋將在我們的決策中發揮重要作用。
第一步:獲取OpenAI GPT-4.5 API密鑰
export OPENAI_API_KEY=KEY
第二步:安裝OpenAI
pip install openai
第三步:導入庫并傳入OpenAI API密鑰
import osfrom openai import OpenAI# Initialize OpenAI client
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))
第四步:設置GPT-4.5的提示詞
gpt_assistant_prompt = "You are a " + input ("Who should I be, as I answer your prompt?")
gpt_user_prompt = input ("What do you want me to do?")
第五步:使用GPT-4.5生成內容
def generate_content(gpt_assistant_prompt: str, gpt_user_prompt: str) -> dict:gpt_prompt = f"{gpt_assistant_prompt} {gpt_user_prompt}"messages = [{"role": "assistant", "content": gpt_assistant_prompt},{"role": "user", "content": gpt_user_prompt}]response = client.chat.completions.create(model="gpt-4.5-preview", # Ensure correct model name is usedmessages=messages,temperature=0.2,max_tokens=1000,frequency_penalty=0.0)response_text = response.choices[0].message.contenttokens_used = response.usage.total_tokensreturn {"response": response_text, "tokens_used": tokens_used}# Call the function
result = generate_content(gpt_assistant_prompt, gpt_user_prompt)
print(result)
結論
每一次計算量的指數級增長都會為大語言模型帶來新的能力。GPT-4.5代表了無監督學習的SOA最前沿模型。OpenAI仍然不斷被社區的創造力所驅動,開發者們總能發現新能力和意想不到的應用方式。借助GPT-4.5大家可以一起探索無監督學習的前沿,共同挖掘新的AI應用和落地的潛能。