DeepSeek官網
目前階段,DeepSeek R1是不能直接生成圖片的,但可以通過優化文本后轉換為SVG或HTML代碼,再保存為圖片。另外,Janus-Pro是DeepSeek的多模態模型,支持文生圖,但需要本地部署或者使用第三方工具。還有第三方AI工具結合DeepSeek生成的提示詞來生成圖片。
DeepSeek 雖然本身并非多模態模型(如 R1 系列),但通過多種方法仍可實現文字生成圖片或處理圖片的需求。以下是我綜合目前多個來源總結的具體方法及步驟:
一、直接生成 SVG 圖片
DeepSeek R1 支持直接生成?SVG 格式的矢量圖代碼,用戶可將其保存為?.svg
?文件并通過瀏覽器查看。具體步驟:
優化文本內容:使用“背景顏色+頁面元素需求+約束條件”模板或模仿特定風格優化原始文本。
- 示例提問:“幫我生成圖片:生成一個高端一點的,純色,漸變的背景圖,不要有其他元素,圖片風格為清新,尺寸為16:9,主色調:科技藍(#007BFF)或環保綠(#28A745),漸變過渡,體現科技感和環保主題”
-
轉換為 SVG:要求 DeepSeek 將優化后的文本轉為 SVG 代碼,并指定配色、布局等要求。
- 示例指令:“將上述內容轉為 SVG 圖片,要求配色簡約,布局清晰。”
- 這樣生成的代碼可直接保存為?
.svg
?文件,或通過在線工具調整樣式。
- 如果覺得生成的樣式是滿意的樣式,則復制整塊內容,創建一個新文件,修改后綴名為 svg,再將內容貼進去就行了。
- 如果你覺得樣式還需要調整,則根據 DeepSeek 提示的配色方案,布局結構等繼續調整,直至滿意為止。
二、利用html代碼完成布局,生成 PNG/JPG 效果圖片
-
若需生成常見格式(如 PNG、JPG),可通過以下兩種方式:
-
生成 HTML 代碼并轉換:
要求 DeepSeek 輸出包含文本內容的 HTML 文件,并嵌入下載按鈕(生成圖片時隱藏按鈕)。例如:先生成一篇
“將回答以攻略卡片風格展示為 HTML,每塊文本對應一個卡片,配色簡約。”
運行 HTML 后,通過瀏覽器截圖或使用工具(如 Puppeteer)導出為圖片。 -
結合 Python 庫:
利用 DeepSeek 生成調用 Pillow 或 Matplotlib 的代碼腳本,自動將文本轉換為圖片。
三、生成 Mermaid 圖表
-
DeepSeek 支持?Mermaid 語法生成流程圖、思維導圖等圖表。步驟:
-
要求生成特定主題的 Mermaid 代碼(如書籍思維導圖)。
-
示例指令:
“生成《悲慘世界》的思維導圖,使用 Mermaid 格式。” -
-
-
將Mermaid數據粘貼至?Mermaid Live 編輯器?渲染并導出為 PNG/SVG
-
四、結合第三方 AI 工具
DeepSeek 非常擅長生成提示詞。所以可以通過 DeepSeek 先生成高質量的提示詞,再借助專業文生圖工具完成創作:
生成提示詞:
-
要求 DeepSeek 輸出英文提示詞(效果優于中文),例如:
“生成一段英文提示詞,描述‘鯨魚躍出海面噴水’的場景,包含細節和藝術風格。” -
使用工具生成圖片:
推薦工具包括 Midjourney(速度快、質量高)、Stable Diffusion(開源可定制)、即夢 AI(支持中文)、Bing Image Creator(基于 DALL·E 3)等。
五、使用多模態模型 Janus-Pro
-
部署步驟:
- 從 GitHub 克隆倉庫,安裝依賴并運行腳本(需 CUDA 支持)。
- 修改配置加載 7B 模型(需 8GB 以上顯存)。
-
生成圖片:
輸入文本指令(如“生成現代風格的城市天際線”),模型會輸出圖片。實測顯示其生成速度較慢,但指令跟隨能力優于 Stable Diffusion。
六、圖片處理與代碼生成
-
示例:
“生成 HTML 代碼,將上傳的圖片轉為像素圓點風格。”
需多次調試代碼并配合工具(如 Photoshop 腳本)實現效果。
總結與建議
-
優先場景:直接生成 SVG 或 Mermaid 圖表適合快速可視化;復雜圖片建議結合第三方工具。
-
性能考量:Janus-Pro 適合本地部署用戶,但對硬件要求較高;普通用戶推薦即夢 AI 或 Midjourney。
-
提示詞優化:通過 DeepSeek 優化提示詞可顯著提升生成質量,尤其是英文提示詞