與阿里云一起
輕松實現數智化
讓算力成為公共服務:用大規模的通用計算,幫助客戶做從前不能做的事情,做從前做不到的規模。讓數據成為生產資料:用數據的實時在線,幫助客戶以數據為中心改變生產生活方式創造新的價值。
圖像編輯大模型特性介紹
Qwen-Image-Edit 成功將 Qwen-Image 獨特的文本渲染能力擴展到圖像編輯任務中,實現了精確的文本編輯。此外,Qwen-Image-Edit 同時將輸入圖像送入 Qwen2.5-VL(用于視覺語義控制)和 VAE 編碼器(用于視覺外觀控制),從而在語義和外觀編輯方面都具備了能力。
語義和外觀編輯:Qwen-Image-Edit 支持低級視覺外觀編輯(例如添加、刪除或修改元素,要求圖像的其他區域保持完全不變)和高級視覺語義編輯(例如 IP 創建、對象旋轉和風格轉換,允許整體像素變化同時保持語義一致性)。
精確的文本編輯:Qwen-Image-Edit 支持雙語(中文和英文)文本編輯,可以直接在圖像中添加、刪除和修改文本,同時保留原始字體、大小和樣式。
強大的基準性能:在多個公開基準上的評估表明,Qwen-Image-Edit 在圖像編輯任務中達到了最先進的(SOTA)性能,確立了其作為強大基礎模型的地位。
快速安裝命令行
在ModelScope開源社區提供的大模型運行環境中,使用以下命令行執行安裝:
代碼使用示例
從ModelScope開源社區的大模型庫,下載阿里云圖像編輯大模型Qwen-Image-Edit到本地開發環境中,導入大模型開發依賴庫,初始化圖像編輯處理器:
設置圖像編輯處理器的基本屬性參數、設置需要編輯處理的圖片輸入參數、設置編輯處理圖片的提示詞需求輸入參數:
使用圖像編輯處理器執行對圖片的編輯處理,輸出已編輯完成的圖片:
模型部署
在阿里云人工智能業務平臺PAI中,查找對應規格的圖像編輯大模型:
在圖像編輯大模型的詳情頁面中,點擊部署按鈕,開始設置部署的屬性參數:
在圖像編輯大模型的部署的屬性參數設置頁面中,設置完成,點擊部署按鈕,開始執行模型部署: