深度剖析!GPT-image-1 API 開放對 AI 繪畫技術生態的沖擊!

4月24日凌晨,OpenAI正式發布了全新的圖像生成模型“gpt-image-1”,并通過API向全球開發者開放使用,這意味著其GPT-4o的圖像生成能力正式向開發者開放!

在這之前,GPT-4o的圖像生成功能于今年3月25日由 OpenAI 創始人兼 CEO 薩姆?阿爾特曼直播發布,次日正式上線,在海內外都掀起了不小的關注和討論。

這是 OpenAI 首次將圖像生成功能直接集成到多模態模型GPT-4o中,通過統一訓練框架,模型能同時理解文本、圖像和上下文,用戶僅需通過自然語言交互,就能實現從文本到圖像的創作。精準指令遵循和上下文感知能力,令 OpenAI 的用戶贊不絕口。

上線僅一天后,GPT-4o生成的吉卜力風格圖片便在網絡上掀起了病毒式傳播。用戶只需簡單指令,就能將普通圖片轉換為吉卜力風格,不管是人物還是城市風景皆可。畫面質感可媲美吉卜力工作室原畫團隊,連 CEO 薩姆?阿爾特曼也直接換上吉卜力風格頭像為 GPT-4o 宣傳。

而4月24日發布的 gpt-image-1 模型,基于 GPT-4o 的多模態能力,同樣能生成吉卜力風格的圖像,同時更勝 GPT-4o 的圖像生成功能,正如 CEO 薩姆?阿爾特曼在其推特上提到的,API版本與ChatGPT版本的不同之處在于:gpt-image-1可以支持各種高級功能的定制,比如控制生成的圖像質量與生成速度、背景、輸出格式等

在API定價方面,gpt-image-1具有明顯優勢。gpt-image-1 API 采用基于 token 的計費方式,文本輸入、圖像輸入和圖像輸出的 token 分別計價,文本輸入 token 每百萬 5 美元,圖像輸入 token 每百萬 10 美元,圖像輸出 token 每百萬 40 美元。

以生成方形圖像為例,低質量圖像每張約 0.02 美元(約 0.15 元人民幣),中等質量每張約 0.07 美元(約 0.50 元人民幣),高質量圖像每張約 0.19 美元(約 1.37 元人民幣)。

此處插入一則通知,中小企業和個人開發者可以通過算力租用實現AI繪畫、AI模型訓練。比如,算力云平臺就專為中小企業和高校實驗室提供算力租用服務,目前有 RTX 4090/3090/2080Ti 等充足的顯卡在香港、臺灣多地域可租用。

無需高配電腦,玩轉AI繪畫!云端快速部署Stable Diffusion的步驟分享!

當前AI繪畫市場主要由 MidJourney 和 Stable Diffusion 主導,MidJourney 以出色的藝術風格表現力和易用性,收獲了大量個人創作者與小型團隊的青睞;Stable Diffusion 憑借開源特性,讓開發者能夠對模型進行個性化調整,在專業領域與企業應用中廣泛扎根。二者已在市場份額、用戶群體及應用場景等方面形成了相對穩定的格局。

然而,gpt-image-1入場極有可能給AI繪畫賽道帶來諸多變數。從技術實力來看,GPT-image-1 基于強大的 GPT-4o 多模態架構,對復雜文本提示的理解與轉化能力十分出眾,能生成細節豐富、精準度高的圖像,甚至在圖像中文字的渲染上達到了新高度,解決了過往AI繪畫文字易出錯、排版混亂的難題,這對注重圖文結合效果的廣告設計、出版印刷等行業而言極具吸引力。功能特性上,它不僅支持多種風格圖像生成,涵蓋寫實、動漫、復古等,還能靈活調整輸出圖像的質量、尺寸、格式等參數,這種高度定制化服務是 MidJourney 和 Stable Diffusion 所欠缺的。

商業合作層面,gpt-image-1 API也已展現出強勁勢頭,Adobe、Figma、Canva 等知名平臺已經紛紛將其集成到自家產品中,借助這些平臺龐大的用戶基礎,GPT-image-1 有望迅速滲透到各類設計工作流程中,改變用戶對AI繪畫工具的選擇傾向。可以預見,隨著 GPT-image-1 的不斷優化與應用,AI 繪畫市場或將重新洗牌,一場圍繞技術、用戶體驗與市場份額的激烈競爭即將拉開帷幕。

以上是算力云今日內容分享,感興趣的朋友多多關注。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79049.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79049.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79049.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

扣子流程圖批量導入飛書多維表格

文章目錄 整體結構分步驟進行處理1. 程序代碼處理2. 多維表格配置 整體結構 整個代碼塊結構如下: 首先,我們從其他流程中拿到一個數據列表,通過一個循環體,將每一個部分的內容都通過python代碼整理后,使用【插件】的…

【安全掃描器原理】端口掃描

【安全掃描器原理】端口掃描 1.端口掃描基本原理2.TCP掃描3.UDP掃描4.手工掃描1.端口掃描基本原理 以TCP端口為例,其原理是當一個主機向遠端一個服務器的某一個端口提出建立連接的請求,如果對方有此項服務,就會同意建立連接,如果對方未安裝此項服務時,則不會同意建立連接…

FastGPT部署的一些問題整理

在B站學習 圖靈程序員-諸葛 的LangChain快速入門課程之《部署FastGPT構建本地應用》。在我學習課程跟著老師實踐的過程中,踩了一些坑。這篇文章以問答的形式記錄一下學習中的一些問題,主要面向的讀者是,在學習同樣的課程的和部署FastGPT遇到各…

如何查看k8s獲取系統是否清理過docker鏡像

k8s集群某個節點down掉后,pod就會漂移到其他節點,但是在該節點卻又執行了拉取鏡像操作,明明該節點之前部署過該容器的,不知為什么又拉取了一次鏡像(鏡像拉取配置的優先使用本地),所以懷疑是觸發…

聚焦智能體未來,領馭科技在微軟創想未來峰會大放異彩

2025年4月23日,微軟創想未來峰會在北京中關村國際創新中心盛大舉行。作為微軟中國南區核心合作伙伴及HKCSP 1T首批授權云服務商,深圳領馭科技有限公司受邀參會,攜瀚鵬工業AI應用解決方案亮相峰會,與全球AI領袖及行業精英共話智能體…

元宇宙2.0:當區塊鏈成為數字世界的憲法

引言:當虛擬世界成為“新大陸” 清晨,你戴上VR設備進入一個由數字建筑構成的城市,這里的地皮屬于全球玩家,街邊的藝術品標著NFT認證碼,咖啡館里的人們用加密貨幣支付咖啡,而社區規則由持有代幣的居民投票決…

力扣hot100——239.滑動窗口最大值

題目鏈接: 239. 滑動窗口最大值 - 力扣(LeetCode) 優先級隊列 優先級隊列自動按照大小排序,隊首即為最大元素,但取隊首時要注意元素是否在滑動窗口內,如果不在則彈出。 class Solution { public:vector&…

Alibaba國際站商品詳情AP接口概述,json數據示例返回參考

前言 Alibaba國際站商品詳情API(通常稱為item_get接口)是阿里巴巴開放平臺提供的一項核心服務,允許開發者通過商品ID獲取商品的詳細信息。該接口廣泛應用于電商系統集成、數據分析、競品監控等場景,支持企業自動化獲取商品標題、…

[論文閱讀]Adversarial Semantic Collisions

Adversarial Semantic Collisions Adversarial Semantic Collisions - ACL Anthology Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP) 對抗樣本是相似的輸入但是產生不同的模型輸出,而語義沖突是對抗樣本的逆…

25【干貨】在Arcgis中根據字段屬性重新排序并自動編號的方法(二)

上一篇關于屬性表自動編號的文章因為涉及到代碼(【干貨】在Arcgis中根據字段屬性重新排序并自動編號的方法(一)),擔心大家有些東西確實不熟悉,今天就更新一篇不需要代碼也能達到這個目的的方法。主要的思路…

從后端研發角度出發,使用k8s部署業務系統

k8s,作為目前最流行的容器編排中間件,大家應該都聽說過,很多公司也都在用,但基本都是運維在管理k8s,開發人員一般涉及不到,開發人員只需要寫業務代碼,然后運維人員負責制作鏡像,然后…

Vue3 Echarts 3D圓柱體柱狀圖實現教程以及封裝一個可復用的組件

文章目錄 前言一、實現原理二、series ——type: "pictorialBar" 簡介2.1 常用屬性 三、代碼實戰3.1 封裝一個echarts通用組件 echarts.vue3.2 首先實現一個基礎柱狀圖3.3 添加上下2個橢圓面3.4 進階封裝一個可復用的3D圓形柱狀圖組件 總結 前言 在前端開發的數據可視…

WPF 上位機開發模板

WPF 上位機開發模板 WPF上位機開發模板,集成了基礎操作菜單、海康視覺實時圖像界面、串口通訊、網口通訊、主流PLC通訊、數據存儲、圖片存儲、參數配置、權限管理、第三方webapi接口接入、數據追溯與查詢等功能。 一、項目結構 WpfSupervisor/ ├── Models/ …

瀏覽器插件,提示:此擴展程序未遵循 Chrome 擴展程序的最佳實踐,因此已無法再使用

1、發現的問題如下: 如果你是比較新的 Chrome 135.0.7049.42(含)以上版本的話,可以通過修改 chorme://flags 來徹底解決。 2、在瀏覽器分別輸入兩個地址: chrome://flags/#extension-manifest-v2-deprecation-disable…

【原創】從s3桶將對象導入ES建立索引,以便快速查找文件

總體功能: 這段程序的作用是: 從指定的S3桶中讀取所有對象的元數據(文件名、大小、最后修改時間、存儲類型、ETag等),并把這些信息寫入到Elasticsearch(ES)中,建立索引&#xff0c…

git 查看用戶信息

在 Git 中查看用戶信息是一項常見的任務,可以幫助你確認當前倉庫的配置或全局的 Git 配置是否正確設置。你可以通過多種方式來查看這些信息。 查看全局用戶信息 全局用戶信息是應用于所有 Git 倉庫的默認設置。要查看全局用戶信息,可以使用以下命令&am…

制作JDK17 arm64基礎鏡像,解決字體安裝問題

1、下載jdk17 arm64的安裝包 官網下載地址 2、編寫Dockerfile 圖形驗證碼生成需要使用到相關字體,所以基礎鏡像把字體相關也安裝上。 # 基礎鏡像 FROM arm64v8/centos:8.4.2105MAINTAINER hqh# 換源 RUN sed -i s|^mirrorlist|#mirrorlist|g /etc/yum.repos.d/…

人工智能數學基礎(三):微積分初步

微積分作為數學的重要分支,為人工智能的發展提供了堅實的理論基礎。從理解數據的變化趨勢到優化模型參數,微積分的應用貫穿其中。本文將深入探討微積分的核心概念,并結合 Python 編程實例,助力大家輕松掌握這些關鍵知識點。資源綁…

區塊鏈密碼學核心

文章目錄 概要1. 基礎密碼學哈希函數(Hash Function)對稱加密與非對稱加密數字簽名(Digital Signature)密鑰管理 2. 區塊鏈專用密碼學技術零知識證明(Zero-Knowledge Proof, ZKP)同態加密(Homom…

Java后端開發day39--方法引用

(以下內容全部來自上述課程) 1.1 含義 把已經有的方法拿過來用,當作函數式接口中抽象方法的方法體。 已經有的方法:可以是Java自己寫的,也可以是第三方的。 示例語句: ::是方法引…