故事背景
stable-diffusion 集成進 dify 后,我們搭建一個小智能體,驗證下文生圖功能
業務流程
節點圖
節點說明
LLM
LLM 節點采用 deepseek-r1 模型,提示詞為:根據用戶輸入的文本,理解并轉換成文生圖提示詞,且提示詞必須是英文,輸出?內容不帶思考過程,以文本輸出
代碼執行
由于大模型生成的文本中,還存在思考過程,這里由于是demo,直接字符串截取,獲取英文prompt
驗證效果
LLM節點輸出的數據為
{"text": "<details style=\"color:gray;background-color: #f8f8f8;padding: 8px;border-radius: 4px;\" open> <summary> Thinking... </summary>\n好的,我現在需要處理用戶的查詢。用戶提供了一段中文文本:“《紅樓夢》中的林黛玉”,然后要求我將其轉換為用于文生圖的提示詞,并且這個提示詞必須是英文,同時不帶任何思考過程,直接輸出結果。\n\n首先,我要理解用戶的需求。他們希望將中文描述轉換成英文的提示詞,用于生成圖像。這可能是因為他們正在使用一個支持英文提示詞的繪圖工具或API,比如DALL·E、MidJourney或者Stable Diffusion等。這些工具通常需要明確且詳細的英文提示詞來生成高質量的圖像。\n\n接下來,我分析用戶提供的文本:“《紅樓夢》中的林黛玉”。這句話提到了兩個關鍵元素:一是作品名稱《紅樓夢》,二是人物林黛玉。因此,提示詞需要包含這兩個信息點,并且可能還需要一些額外的描述來幫助生成更準確的畫面。\n\n考慮到繪圖模型通常對細節和氛圍比較敏感,我應該在提示詞中添加一些環境或風格的描述。例如,“古典中國文學作品”可以傳達出《紅樓夢》的文化背景;“憂郁而優雅”則能描繪林黛玉的性格特點;再加上“傳統服飾”來具體化人物的形象。\n\n然后,我會把這些元素組合成一個連貫的英文句子。確保用詞準確且自然流暢,避免過于生硬或直譯。例如,“A melancholic and elegant character from the classic Chinese literary work 'Dream of the Red Chamber'”能夠很好地表達林黛玉的角色特質和作品背景;“dressed in traditional Chinese attire”則進一步細化了人物的外貌特征。\n\n最后,檢查整個提示詞是否完整,是否有遺漏的關鍵信息。確保沒有語法錯誤,并且每個部分都清晰傳達給繪圖模型,以便生成符合預期的畫面。\n</details>\n\nA melancholic and elegant character from the classic Chinese literary work \"Dream of the Red Chamber\", dressed in traditional Chinese attire","usage": {"prompt_tokens": 45,"prompt_unit_price": "0","prompt_price_unit": "0","prompt_price": "0E-7","completion_tokens": 402,"completion_unit_price": "0","completion_price_unit": "0","completion_price": "0E-7","total_tokens": 447,"total_price": "0E-7","currency": "USD","latency": 42.33978042751551},"finish_reason": "stop"
}