深度剖析！GPT-image-1 API 開放對 AI 繪畫技術生態的沖擊！

4月24日凌晨，OpenAI正式發布了全新的圖像生成模型“gpt-image-1”，并通過API向全球開發者開放使用，這意味著其GPT-4o的圖像生成能力正式向開發者開放！

在這之前，GPT-4o的圖像生成功能于今年3月25日由 OpenAI 創始人兼 CEO 薩姆?阿爾特曼直播發布，次日正式上線，在海內外都掀起了不小的關注和討論。

這是 OpenAI 首次將圖像生成功能直接集成到多模態模型GPT-4o中，通過統一訓練框架，模型能同時理解文本、圖像和上下文，用戶僅需通過自然語言交互，就能實現從文本到圖像的創作。精準指令遵循和上下文感知能力，令 OpenAI 的用戶贊不絕口。

上線僅一天后，GPT-4o生成的吉卜力風格圖片便在網絡上掀起了病毒式傳播。用戶只需簡單指令，就能將普通圖片轉換為吉卜力風格，不管是人物還是城市風景皆可。畫面質感可媲美吉卜力工作室原畫團隊，連 CEO 薩姆?阿爾特曼也直接換上吉卜力風格頭像為 GPT-4o 宣傳。

而4月24日發布的 gpt-image-1 模型，基于 GPT-4o 的多模態能力，同樣能生成吉卜力風格的圖像，同時更勝 GPT-4o 的圖像生成功能，正如 CEO 薩姆?阿爾特曼在其推特上提到的，API版本與ChatGPT版本的不同之處在于：gpt-image-1可以支持各種高級功能的定制，比如控制生成的圖像質量與生成速度、背景、輸出格式等。

在API定價方面，gpt-image-1具有明顯優勢。gpt-image-1 API 采用基于 token 的計費方式，文本輸入、圖像輸入和圖像輸出的 token 分別計價，文本輸入 token 每百萬 5 美元，圖像輸入 token 每百萬 10 美元，圖像輸出 token 每百萬 40 美元。

以生成方形圖像為例，低質量圖像每張約 0.02 美元（約 0.15 元人民幣），中等質量每張約 0.07 美元（約 0.50 元人民幣），高質量圖像每張約 0.19 美元（約 1.37 元人民幣）。

此處插入一則通知，中小企業和個人開發者可以通過算力租用實現AI繪畫、AI模型訓練。比如，算力云平臺就專為中小企業和高校實驗室提供算力租用服務，目前有 RTX 4090/3090/2080Ti 等充足的顯卡在香港、臺灣多地域可租用。

無需高配電腦，玩轉AI繪畫！云端快速部署Stable Diffusion的步驟分享！

當前AI繪畫市場主要由 MidJourney 和 Stable Diffusion 主導，MidJourney 以出色的藝術風格表現力和易用性，收獲了大量個人創作者與小型團隊的青睞；Stable Diffusion 憑借開源特性，讓開發者能夠對模型進行個性化調整，在專業領域與企業應用中廣泛扎根。二者已在市場份額、用戶群體及應用場景等方面形成了相對穩定的格局。

然而，gpt-image-1入場極有可能給AI繪畫賽道帶來諸多變數。從技術實力來看，GPT-image-1 基于強大的 GPT-4o 多模態架構，對復雜文本提示的理解與轉化能力十分出眾，能生成細節豐富、精準度高的圖像，甚至在圖像中文字的渲染上達到了新高度，解決了過往AI繪畫文字易出錯、排版混亂的難題，這對注重圖文結合效果的廣告設計、出版印刷等行業而言極具吸引力。功能特性上，它不僅支持多種風格圖像生成，涵蓋寫實、動漫、復古等，還能靈活調整輸出圖像的質量、尺寸、格式等參數，這種高度定制化服務是 MidJourney 和 Stable Diffusion 所欠缺的。

商業合作層面，gpt-image-1 API也已展現出強勁勢頭，Adobe、Figma、Canva 等知名平臺已經紛紛將其集成到自家產品中，借助這些平臺龐大的用戶基礎，GPT-image-1 有望迅速滲透到各類設計工作流程中，改變用戶對AI繪畫工具的選擇傾向。可以預見，隨著 GPT-image-1 的不斷優化與應用，AI 繪畫市場或將重新洗牌，一場圍繞技術、用戶體驗與市場份額的激烈競爭即將拉開帷幕。

以上是算力云今日內容分享，感興趣的朋友多多關注。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/79049.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/79049.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/79049.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！