OpenAI 對 ChatGPT 進行重大升級,圖像生成功能即將迎來新的 4o 模型,并取代原本的 DALL·E。此次更新不僅提升了圖像生成質量,還增強了對話內容和上傳文件的融合能力,使 AI 生成的圖像更加智能化和精準化。
4o 模型帶來的革新
OpenAI 宣布,基于 4o 模型的 ChatGPT 在圖像生成和處理方面實現了多項突破。
這包括更精確地理解指令、更強的上下文感知能力以及更優化的文本渲染效果。這意味著,用戶可以更加精準地控制圖像的細節,并在各種場景下獲得更符合預期的視覺輸出。
此外,4o 模型是全模態(Omnimodal)的,這意味著它可以同時處理文本、音頻和圖像,而不再需要多個獨立模型進行信息傳遞。這種架構上的革新,不僅提高了生成速度,也降低了因多模型交互導致的錯誤。
此次更新將逐步向 Plus、Pro、Teams 和免費賬戶開放,而企業(Enterprise)和教育(Edu)客戶的支持將在稍后推出。
更高質量的圖像生成
4o 模型在多個方面提升了圖像生成質量。例如,它可以更精準地生成圖表、信息圖、Logo以及社交媒體推廣圖形,并支持使用十六進制顏色代碼。
由于文本渲染能力的增強,用戶甚至可以設計名片或制作具有透明背景的圖像,以便直接用于演示文稿或其他創作場景。
此外,該模型還支持基于模板修改圖像。例如,用戶可以上傳客廳照片,讓 AI 生成不同風格的室內設計方案。OpenAI 還展示了一個應用場景,即根據對話內容生成特定主題的圖像,例如中央公園的鳥類圖鑒或某個歷史時代的可視化場景。
值得一提的是,OpenAI 采用開放標準 C2PA,對所有 AI 生成的圖像進行溯源標記。這一技術被廣泛用于驗證照片的真實性,以減少虛假信息的傳播。
潛在的風險與道德爭議
隨著 4o 模型的強大能力逐漸展現,一些風險也浮出水面。例如,新模型在生成圖像文本方面的精準度,使得偽造票據變得前所未有的簡單。
有社交媒體用戶成功用 4o 生成了逼真的餐廳收據,其中甚至包括污漬和折痕,使其看上去極具真實性。
這引發了人們對欺詐風險的擔憂。例如,不法分子可能利用 AI 生成的收據偽造不存在的開支,從而騙取報銷。盡管 OpenAI 規定禁止 AI 被用于欺詐行為,但如何有效防止這一風險仍然是個難題。
OpenAI 回應
針對 AI 生成偽造收據的問題,OpenAI 發言人表示,所有由 ChatGPT 生成的圖像都會包含元數據,以表明其來源。同時,公司會持續監測用戶行為,確保其符合 OpenAI 的使用政策。
然而,OpenAI 也強調,AI 生成的假收據并不一定用于欺詐場景。例如,它可以用于學習財務知識,或為創作原創藝術和廣告提供素材。
OpenAI CEO Sam Altman 也在社交平臺上表示,公司希望賦予用戶更大的創作自由,同時會關注社會的反饋,并適時調整策略。
ChatGPT 迎來 4o模型:更強大的圖像生成能力與潛在風險
2025年科技行業裁員潮:全球近3萬名員工受影響
最新 AGI 測試讓 GPT-4.5、Claude 3.7 全軍覆沒