【AI學習筆記】Coze平臺實現生成小紅書熱門多圖筆記

背景前搖&原視頻教程:

最近總是在小紅書上刷到多圖組成的養生小妙招、效率提升小tips、退休奶奶療愈語錄等等這樣的圖文筆記,而且人物圖像一眼就是AI畫的。
當時我以為這個排版和文字是人工的,就讓AI保持角色一致性畫了下圖,沒想到在B站刷到了實現教程,才知道Coze平臺已經支持很完善的一鍵出筆記的工作流了。

B站上優秀的視頻教程:

對比了我主動搜索+推薦算法推送的教程,最后跟著UP @在下李君陌 的教程學完了整個工作流,確實成功實現了出圖文筆記的效果。
原視頻鏈接:https://www.bilibili.com/video/BV1Xa5QzpEKM/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
傳送門
在這里插入圖片描述而且這個UP特別好的是,把用到的演示文稿直接就放在了簡介里,直接飛書就可以打開,無需再三連私信求資料,最后被賣課的反復騷擾,簡直就是超級良心。在這里插入圖片描述
因為原UP的視頻已經很詳細了,大家跟著學一定能順利實踐出真知,我就不再贅述UP的視頻里面已經介紹的如何搭建工作流的相關過程了。本文只分享一些我個人遇到的問題和心得。

跟完教程后生成的圖文筆記預期效果:

我這里選定的主題是“香港旅游”,想著順帶幫親戚做個旅游攻略。
在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述
在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述
封面圖+5張簡單的圖文筆記,效果還不錯~

學習準備:

1.9.9的氪金費用,因為這個工作流有很多圖像生成節點,可能Coze平臺默認的額度不夠用,必要時需要氪金開個個人進階版,或者增購資源包。在這里插入圖片描述
2.至少兩個小時的學習時間,原UP視頻長約一個半小時,加上大家自己摸索、連圖、調試的時間,如果是Coze新手,需要的時間會更長。
3.一些Coze平臺的基礎知識,至少知道如何搭建工作流和傳遞參數,讓一個工作流完整跑起來。如果對Coze完全一無所知,建議先看Coze官方視頻教程:傳送門
https://www.bilibili.com/video/BV1zC35eFEyN?spm_id_from=333.788.videopod.sections&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
4.其他原視頻UP在講解過程中要求準備的東西,比如飛書演示文檔(后面復制提示詞會用到,或者實在沒有的話,截圖OCR文字識別也可),放在桌面上的幾張組成模板用的底圖。
在這里插入圖片描述

正文:

大家如果順利跟著UP的視頻走完了全流程以后,應該工作流會長下面這樣:是一個能生成5張圖文+一個主圖封面的工作流,并且每個頁面又有兩張組成圖片。在這里插入圖片描述在這里插入圖片描述
在這里插入圖片描述

1.圖像調用節點受限問題:

如果按照上面這樣連接節點,邏輯是沒問題的,但是調用起來會發現工作流會被中途中斷,因為同時調用的圖像節點太多了。在這里插入圖片描述
中道崩殂不說,還白燒了不少token,簡直讓人心疼。
在這里插入圖片描述
B站視頻評論區也有碼友遇到這個問題,給出的解決方法是拆成幾個工作流調用。
在這里插入圖片描述
這樣應該也可行,我沒有自己嘗試過,不過我采用了另一種方法來規避這個問題。
那就是——把工作流連成一條長直線!
在這里插入圖片描述
也就是說,把第一頁的大模型節點和封面的畫板節點連起來,再把第一頁的畫板節點和第二頁的大模型節點連接起來。在這里插入圖片描述

在這里插入圖片描述可以理解為,原作者那樣的結構,封面、不同頁之間是并聯關系。大模型節點生成提示詞以后,同時在生成封面和五頁內容的圖,這樣就導致圖像節點調用過多,超限制了。
在這里插入圖片描述
上圖中單個淺藍色的節點里面,構成了能組成一張單圖的基本邏輯:在這里插入圖片描述
而我把封面和不同頁的生成順序變成了串聯關系,先生成封面,再生成第一頁,然后是第二頁,單張圖文筆記生成的邏輯并沒有改變,所以不影響出圖效果。在這里插入圖片描述
每個淺藍色節點生成圖片的邏輯依舊是這樣,沒有改變:
在這里插入圖片描述
因為只要通路是連著的,后續的節點可得到前面任意節點的輸出,所以并不影響每一頁的大模型節點提取對應的小技巧,也不影響最后結束節點一次性輸出五張圖。在這里插入圖片描述在這里插入圖片描述
這樣雖然運行速度稍微慢一些,但是一個工作流內就可以實現生成全部圖文,并且不會報圖像節點受限的問題。
當然,如果覺得這樣擺成一長條不太美觀的話,也可把生成單張頁面的幾個節點按shift選中(或者鼠標左鍵長按拖拽框選),把他們作為一個組合(可以自行選擇是否封裝工作流,這里我為了清晰沒用封裝),拖拽成一排排的。
在這里插入圖片描述
下面這樣是不是就跟原視頻UP的工作流比較像啦?其實在我按原UP的并聯工作流改為串聯邏輯以后,這就是這個串聯工作流最初的樣子。在這里插入圖片描述其實我最開始演示的一條直線的工作流,就是現在這個工作流點擊了“優化布局”按鈕重排后,整個工作流被拉直后的結果。在這里插入圖片描述
(串聯工作流偶爾也會遇到執行不成功的情況,但多試幾次就可以了!)

2.圖片生成內容更寬泛:

原作者跟著做的模板是人類養生相關的,圖片生成模型選的是“人像”,并且給了參考圖,但這就導致圖文筆記能生成的內容相對受限,很多圖片都會畫個人在中間。
但我希望做的主題是“香港旅游”,很多生成的貼士是跟旅游景點相關的,比如叮叮車、天星小輪,但是按照原來的設定,生成的很多配圖主體物都是人,摳圖完后基本上只剩下一個人的輪廓了,就跟我們的旅游場景不搭配。
我把所有節點選用的圖像生成模型全部都改成了**“通用Pro”**,這樣不但可以支持生成人像,也可以根據不同主題的提示詞生成其他景物、美食等圖片。通用模型畫什么其實更多取決于得到什么提示詞,如果前面生成提示詞的大模型判斷出來這個小貼士需要出現人物在畫面里,通用模型也可生成。
原作者給的參考圖我也去掉了,感覺有跟沒有差別并不大,很多時候參考圖并沒有發揮其該有的作用,很多時候不但人物崩壞,還很重復,出現人長得有些相似,但是一致性又不夠(就是倒像不像,很難說這倆是一個人,但又不是完全不像),畫風還不統一(有的寫實風,有的卡通風)、還有多手多腳、畫面結構混亂等問題。
綜合考慮感覺,不同小貼士之間人跟人長得一不一樣并不重要,就算是養生場景,展示的路人A在泡腳,路人B在做操也沒有關系。所以就讓模型更自由發揮了。在這里插入圖片描述
修改后,不但之前UP測試的養生、提效、告別拖延場景可適配,我想實現的旅游場景也能實現了。在這里插入圖片描述在這里插入圖片描述

3.實現圖文效果的提示詞:

這部分是我覺得很意外也很驚喜的點,我一直以為要生成這樣有封面+五張圖的內容,提示詞會很復雜,這些一段那寫一段,沒想到總共就三個部分。
這里原視頻作者寫得就很好,并且因為其文檔是公開分享的,我就直接截圖了。
首先是這個最重要的大模型節點,除了決定吸睛的首圖標題元素以外,還是后面幾頁內容的根基。
我一度以為要用很長的篇幅給大模型描述,我要做個什么樣的小紅書圖文排版,各種跟他解釋我整個排版要怎樣關聯,怎樣布局…
結果居然是這樣簡單,就告訴他,我要主標題副標題短標題,有什么字數要求,還要按照標題生成10個符合要求的實操技巧,就完事了。
至于排版的部分,是搭建好的畫板來解決,如果布局不好看,比如字數超了導致換行、沒對齊,再跟大模型進一步調整限制字數的要求。
在這里插入圖片描述
然后就是生成各頁面的大模型節點,負責來提取前面生成的、自己負責的這部分小貼士的主題,并且以此進一步生成畫圖的提示詞。
我以為提取內容這部分少說需要寫代碼,然后中間再把需求描述給GPT讓它代勞實現代碼邏輯,沒想到大模型直接就把提取內容整個活做了。
原視頻UP也說,簡單的內容提取可以交給大模型做,確認它完成得也很優秀,免得我把需求給另外的AI描述半天,然后測試代碼等折騰了。只需要針對不同頁的大模型,把提取哪幾條小技巧(下圖黃色高亮部分,比如第一頁提取1-2條小技巧,第二頁提取3-4條小技巧…)改一下即可。
這段提示詞同時還做了生成給后面的圖像生成節點構造提示詞的任務,甚至都沒有分段或者分點,行云流水一氣呵成,但是效果非常到位,看來模型對提示詞的理解能力非常好,沒用遺漏或者誤解這一段話的好幾個需求,可以說是《高端的食材只需要最簡單的烹飪方式》?
在這里插入圖片描述
最后就是生成圖片的指令,這個就相對普通平常了,為了不至于摳完圖后主體物被切掉太多部分,所以讓周圍留出一些距離。在這里插入圖片描述整個過程是調用了三層大模型,第一層總大模型負責圍繞用戶輸入的主題,生成標題和10個小貼士作為大的框架,第二層是每一頁的大模型,負責專注自己的那部分小貼士,補全細化文本內容,并且生成給圖像模型的提示詞,第三層每張圖的圖像生成模型負責按照輸入指令生成圖片。

簡短總結:

整個工作流的結構,大模型、畫圖節點的調用方式,以及簡明干練的提示詞描述能力,很值得學習和借鑒,感謝原UP帶來這么棒的教程。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/84799.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/84799.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/84799.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何選擇自動化編程平臺

從事自動化行業的工作者都知道,做PLC編程需要PLC編程軟件,做HMI可視化需要HMI編程軟件,做SCADA需要SCADA編程軟件,做DCS需要DCS軟件,做仿真調試需要仿真軟件。這些軟件有國外的、國內的,有傳統自動化廠商開…

Bug 背后的隱藏劇情

Bug 背后的隱藏劇情 flyfish 1. 「bug」:70多年前那只被拍進史書的飛蛾 故事原型:1947年哈佛實驗室的「昆蟲命案」 1947年的計算機長啥樣?像一間教室那么大,塞滿了幾萬根繼電器(類似老式開關)&#xff…

如何將通話記錄從Android傳輸到Android

“如何將通話記錄從 Android 轉移到 Android?我換了一部新的 Android 手機,想要將通話記錄復制到其中。”您需要將通話記錄從 Android 傳輸到 Android 是一種常見的情況,因為通話記錄是手機上最重要的數據之一。幸運的是,如果您從…

Android 云手機橫屏模式下真機鍵盤遮擋輸入框問題處理

一、背景 打開橫屏應用,點擊云機EditText輸入框,輸入框被鍵盤遮擋,如下圖: 未打開鍵盤狀態: 點擊第二個輸入框,鍵盤遮擋了輸入框: 二、解決方案(推薦第三中方案,博主采用的也是第三種方案) 博主這里整理了三種方案:…

進程IO之 進程

一、進程相關概念 1.什么是進程 程序:靜態的,編譯好的可執行文件,存放在磁盤中的指令和數據的集合 進程:動態的,是程序的一次執行過程,是獨立的可調度的任務 2.進程的特點 (1)對…

Condition源碼解讀(二)

本章我們繼續將Condition的最后一個方法signal方法,如果前面沒有看過的可以點擊LockSupport與Condition解析來看看Condition解讀的前半部分。 signal方法: public final void signal() {if (!AbstractQueuedLongSynchronizer.this.isHeldExclusively())…

股票收益率的計算

首先,需要從 Tushare.pro 注冊一個賬號并調用其API獲取股票日線數據(具體操作請查看官網)。 以通過調用tushare獲取股票000001(平安銀行)的股票數據為例,這里不設置日期,那么默認獲取Tushare提供的所有歷史數據。也可…

《算法筆記》13.2小節——專題擴展->樹狀數組(BIT) 問題 D: 數列-訓練套題T10T3

數列(sequence.pas/c/cpp) - 問題描述 一個簡單的數列問題&#xff1a;給定一個長度為n的數列&#xff0c;求這樣的三個元素ai, aj, ak的個數&#xff0c;滿足ai < aj > ak&#xff0c;且i < j < k。 - 輸入數據 第一行是一個整數n(n < 50000)。 第二行n個整…

C# Windows Forms應用程序-001

目錄 項目概述 主要組件及功能 類定義 控件聲明 構造函數 Dispose 方法 InitializeComponents 方法 控件配置詳解 Button 控件 (button1) TextBox 控件 (textBox1) GroupBox 控件 (groupBox1) Label 控件 (label1 至 label5) OpenFileDialog 控件 (openFileDialog1…

2025.5.28總結

今日工作&#xff1a;最近進入了項目的關鍵節點&#xff0c;要求每人每天提兩單&#xff0c;今天周三&#xff0c;下班前只提了一個單。下午開了一場需求服務驗收會&#xff0c;我演示了自己驗收的那個需求&#xff0c;然后講的不是很好。當初再構造數據時請教了一個人&#xf…

Transformer核心技術解析LCPO方法:精準控制推理長度的新突破

原創文章1FFN前饋網絡與激活函數技術解析&#xff1a;Transformer模型中的關鍵模塊2Transformer掩碼技術全解析&#xff1a;分類、原理與應用場景3【大模型技術】Attention注意力機制詳解一4Transformer模型中位置編碼&#xff08;Positional Embedding&#xff09;技術全解析(…

在 WSL 中安裝 JetBrains Toolbox:完整指南

JetBrains Toolbox 是一個非常實用的工具&#xff0c;它可以幫助開發者輕松管理 JetBrains 的各種開發工具&#xff0c;如 IntelliJ IDEA、PyCharm、WebStorm 等。通過它&#xff0c;你可以快速安裝、更新和管理這些工具&#xff0c;極大地提高了開發效率。而在 WSL 環境中安裝…

ZooKeeper 命令操作

文章目錄 Zookeeper 數據模型Zookeeper 服務端常用命令Zookeeper 客戶端常用命令 Zookeeper 數據模型 ZooKeeper 是一個樹形目錄服務,其數據模型和Unix的文件系統目錄樹很類似&#xff0c;擁有一個層次化結構。這里面的每一個節點都被稱為&#xff1a; ZNode&#xff0c;每個節…

Turf.js:前端地理空間分析的瑞士軍刀

在Web開發中,地理空間數據處理已成為許多應用的核心需求。從地圖可視化到位置服務,再到復雜的數據分析,前端開發者需要強大的工具來處理這些任務。Turf.js 作為一款輕量級、模塊化的地理空間分析庫,憑借其豐富的功能和易用性,成為前端開發者的得力助手。本文將深入探討 Tu…

大模型微調

使用 Ollama 微調大語言模型&#xff08;如 LLaMA、Mistral、Gemma 等&#xff09;主要是圍繞 LoRA&#xff08;Low-Rank Adaptation&#xff09;或者 QLoRA 等輕量級微調技術進行的。Ollama 本身是一個部署和運行本地大語言模型的平臺&#xff0c;但其微調能力有限&#xff0c…

《自動駕駛軌跡規劃實戰:Lattice Planner實現避障路徑生成(附可運行Python代碼)》—— 零基礎實現基于離散優化的避障路徑規劃

《自動駕駛軌跡規劃實戰&#xff1a;Lattice Planner實現避障路徑生成&#xff08;附可運行Python代碼&#xff09;》 —— 零基礎實現基于離散優化的避障路徑規劃 一、為什么Lattice Planner成為自動駕駛的核心算法&#xff1f; 在自動駕駛的路徑規劃領域&#xff0c;Lattice…

切換到舊提交,同時保證當前修改不丟失

在 Git 中&#xff0c;可以通過以下幾種方式切換到之前的提交&#xff0c;同時保留當前的提交&#xff08;即不丟失工作進度&#xff09;&#xff1a; 1. 使用 git checkout 創建臨時分離頭指針&#xff08;推薦用于查看&#xff09; git checkout <commit-hash>這會讓…

zookeeper 操作總結

zookeeper 中的節點類型 節點類型命令選項說明?持久節點?無選項&#xff08;默認&#xff09;永久存在&#xff0c;除非手動刪除。?臨時節點?-e與客戶端會話綁定&#xff0c;會話結束自動刪除&#xff08;?不能有子節點?&#xff09;。?順序節點?-s節點名自動追加遞增…

nova14 ultra,是如何防住80°C熱水和10000KPa水壓沖擊的?

暴雨突襲&#xff0c;手忙腳亂護住背包&#xff0c;卻擔心手機被雨水浸濕&#xff1b;泳池里想記錄美好時刻&#xff0c;卻擔心手機掉入水中 &#xff1b;廚房里充滿了高溫水汽&#xff0c;近距離拍攝美食瞬間&#xff0c;手機屏幕花屏&#xff0c;讓人失去了對美食的興趣…… …

flutter加載dll 報錯問題

解決flutter加載dll 報錯問題 LoadLibrary 報錯 126 or 193 明確一點&#xff1a;flutter構建exe 時默認是MSVC的。 1. 先檢查dll 的位數是否滿足 file ***.dll output: PE32 executable (DLL) (console) x86-64, for MS Windows, 19 sections 這種是64位的機器。 滿足的話可…