4月24日凌晨,OpenAI正式發布了全新的圖像生成模型“gpt-image-1”,并通過API向全球開發者開放使用,這意味著其GPT-4o的圖像生成能力正式向開發者開放!
在這之前,GPT-4o的圖像生成功能于今年3月25日由 OpenAI 創始人兼 CEO 薩姆?阿爾特曼直播發布,次日正式上線,在海內外都掀起了不小的關注和討論。
這是 OpenAI 首次將圖像生成功能直接集成到多模態模型GPT-4o中,通過統一訓練框架,模型能同時理解文本、圖像和上下文,用戶僅需通過自然語言交互,就能實現從文本到圖像的創作。精準指令遵循和上下文感知能力,令 OpenAI 的用戶贊不絕口。
上線僅一天后,GPT-4o生成的吉卜力風格圖片便在網絡上掀起了病毒式傳播。用戶只需簡單指令,就能將普通圖片轉換為吉卜力風格,不管是人物還是城市風景皆可。畫面質感可媲美吉卜力工作室原畫團隊,連 CEO 薩姆?阿爾特曼也直接換上吉卜力風格頭像為 GPT-4o 宣傳。
而4月24日發布的 gpt-image-1 模型,基于 GPT-4o 的多模態能力,同樣能生成吉卜力風格的圖像,同時更勝 GPT-4o 的圖像生成功能,正如 CEO 薩姆?阿爾特曼在其推特上提到的,API版本與ChatGPT版本的不同之處在于:gpt-image-1可以支持各種高級功能的定制,比如控制生成的圖像質量與生成速度、背景、輸出格式等。
在API定價方面,gpt-image-1具有明顯優勢。gpt-image-1 API 采用基于 token 的計費方式,文本輸入、圖像輸入和圖像輸出的 token 分別計價,文本輸入 token 每百萬 5 美元,圖像輸入 token 每百萬 10 美元,圖像輸出 token 每百萬 40 美元。
以生成方形圖像為例,低質量圖像每張約 0.02 美元(約 0.15 元人民幣),中等質量每張約 0.07 美元(約 0.50 元人民幣),高質量圖像每張約 0.19 美元(約 1.37 元人民幣)。
此處插入一則通知,中小企業和個人開發者可以通過算力租用實現AI繪畫、AI模型訓練。比如,算力云平臺就專為中小企業和高校實驗室提供算力租用服務,目前有 RTX 4090/3090/2080Ti 等充足的顯卡在香港、臺灣多地域可租用。
無需高配電腦,玩轉AI繪畫!云端快速部署Stable Diffusion的步驟分享!
當前AI繪畫市場主要由 MidJourney 和 Stable Diffusion 主導,MidJourney 以出色的藝術風格表現力和易用性,收獲了大量個人創作者與小型團隊的青睞;Stable Diffusion 憑借開源特性,讓開發者能夠對模型進行個性化調整,在專業領域與企業應用中廣泛扎根。二者已在市場份額、用戶群體及應用場景等方面形成了相對穩定的格局。
然而,gpt-image-1入場極有可能給AI繪畫賽道帶來諸多變數。從技術實力來看,GPT-image-1 基于強大的 GPT-4o 多模態架構,對復雜文本提示的理解與轉化能力十分出眾,能生成細節豐富、精準度高的圖像,甚至在圖像中文字的渲染上達到了新高度,解決了過往AI繪畫文字易出錯、排版混亂的難題,這對注重圖文結合效果的廣告設計、出版印刷等行業而言極具吸引力。功能特性上,它不僅支持多種風格圖像生成,涵蓋寫實、動漫、復古等,還能靈活調整輸出圖像的質量、尺寸、格式等參數,這種高度定制化服務是 MidJourney 和 Stable Diffusion 所欠缺的。
商業合作層面,gpt-image-1 API也已展現出強勁勢頭,Adobe、Figma、Canva 等知名平臺已經紛紛將其集成到自家產品中,借助這些平臺龐大的用戶基礎,GPT-image-1 有望迅速滲透到各類設計工作流程中,改變用戶對AI繪畫工具的選擇傾向。可以預見,隨著 GPT-image-1 的不斷優化與應用,AI 繪畫市場或將重新洗牌,一場圍繞技術、用戶體驗與市場份額的激烈競爭即將拉開帷幕。
以上是算力云今日內容分享,感興趣的朋友多多關注。