《扣子開發AI Agent智能體應用(人工智能技術叢書)》(宋立桓,王東健,陳銘毅,程東升)【摘要 書評 試讀】- 京東圖書
《扣子開發AI Agent智能體應用》案例重現 開發agent智能體的書籍-CSDN博客
工作流是指一系列相互關聯的步驟或任務,用于完成特定的業務過程或項目。它定義了任務的順序、執行者以及相關的條件和規則,以確保流程的順利進行和最終目標的達成。本章將介紹扣子工作流的分類、解決的問題、邏輯結構。
工作流及其分類
工作流在日常工作中很常見。例如,財務報銷要經過填寫報銷單、提交發票、財務審核、分管領導審核等步驟,就是典型的工作流;軟件開發領域的CI/CD流水線也是一種工作流。扣子的工作流與傳統工作流類似,但也有不同之處。傳統工作流既可以手動執行,也可以自動執行,或者二者結合。扣子的工作流是一種自動執行多個相關步驟的可復用流程,一個Bot可以使用多個工作流,即Bot可以根據用戶的行為選擇并執行不同的工作流。
1. 扣子工作流
扣子工作流是一種通過可視化方式,組合插件、大語言模型、代碼塊等功能節點,用于實現復雜業務邏輯的流程編排。它允許用戶通過拖放的方式,將不同的功能節點連接起來,形成一個完成特定任務的工作流程,使得解決問題的邏輯更加清晰,輸出更加穩定和可靠。講到這里,自然會產生一個疑問:為什么大模型不直接執行完成相關的任務,告訴我們結果就行?為什么還要引入一個工作流?
原因很簡單,雖然現在的大模型比較智能,但是還沒有達到絕頂智能的程度。大模型(或者說生成式AI)是基于概率來生成內容的,這就意味著它并不是每次都能給出符合要求的結果,特別是對返回結果要求比較精確的場景。
工作流的核心在于將大模型的能力與特定的業務邏輯相結合,通過系統化、流程化的方法來實現高效、可擴展的AI應用開發。工作流也是對當前大模型能力不足的一種補償機制,在大模型智能化程度還不夠高的時候,通過人為編排的工作流(注入人的智能),讓智能體具有更高的可用性和可靠性,從而提升用戶體驗。
2. 扣子工作流的分類
扣子提供以下兩種類型的工作流:
(1)工作流(Workflow):用于處理功能類的請求,可通過順序執行一系列節點實現某個功能。適合數據的自動化處理場景,例如生成行業調研報告、生成一張海報、制作繪本等。
(2)對話流(Chatflow):是基于對話場景的特殊工作流,更適合處理對話類請求。對話流通過對話的方式與用戶交互,并完成業務邏輯。
相較于工作流而言,對話流更適合處理對話場景下的交互邏輯。每個對話流都綁定了一個會話,運行時可以從此會話中讀取歷史消息,同時將本次運行對話流產生的消息記錄在這個會話中,相當于一個擁有了記憶的工作流。
你如果需要搭建一個智能體,智能體本身支持上下文和會話能力,那么可以隨意選擇工作流或對話流。
如果你需要搭建一個對話式的AI應用,例如AI助手、智能體客服等基于對話方式交互的AI應用,推薦你使用對話流。對話流中的大模型可以讀取會話上下文、管理會話,還可以搭建對話式的用戶界面,并發布到各種社交通信軟件中。
如果你需要搭建一個工具類的AI應用,用來批量處理數據、實現任務流程的自動化,可以選擇工作流實現。
工作流能解決什么問題
既然我們已經對扣子的工作流有所了解,那么工作流能解決什么問題?或者說在什么情況下要使用工作流?根據作者自己的理解給出一些適用場景,供讀者參考。
1. 使用提示詞無法達到預期效果的場景
在Coze平臺搭建Bot智能體時,一般先從編寫提示詞開始。有時我們按照提示詞工程技巧編寫了清晰明確的結構化指令,經過反復迭代優化,仍然達不到預期效果,那么可以考慮采用工作流。例如,在長文本寫作(如調研報告)中,先要收集相關資料,生成寫作大綱,劃分各個章節,再對各個章節進一步收集資料、逐步生成內容,最后進行總結。僅僅通過提示詞,大模型可能難以產生一篇結構合理、內容翔實的文章,這時可以通過工作流來實現。
2. 需要多次調用插件或外部工具的場景
有些大模型具有Function Call能力,可以調用外部工具。但如果需要調用多個外部工具,且它們具有嚴格依賴關系時,大模型可能不是每次都能很好地完成目標。例如,我們需要根據一個URL獲取網頁內容、總結要點、生成思維導圖。其中,“網頁內容抓取”和“生成思維導圖”兩個步驟都需要調用外部工具(插件),中間還需要大模型來總結要點。在這種情況下,通過工作流可以實現高效的流程管理。
3. 需要使用代碼加工數據或生成響應的場景
我們利用大模型雖然能夠產出還不錯的內容,但是很難對數據進行精確處理。在這種情況下,可以使用工作流中的代碼節點來解決精確處理的問題。在Coze官方文檔中介紹了一個使用工作流和代碼節點生成隨機數的例子,讀者可以查閱一下。
4. 需要根據某個條件執行不同分支來處理的場景
例如,開發一個答題Bot,根據用戶選擇的不同選項來回復不同的內容。
5. 需要在一次用戶請求中多次輸出消息的場景
大模型的工作方式是一問一答,即根據輸入產生輸出。在一些比較復雜的應用中,可能需要對一次用戶的問題回復多條消息;或者一次完整輸出的耗時較長,為了提高用戶體驗,需要分為多次輸出。在這種場景中,可以在工作流中使用消息節點來實現多次輸出。
扣子工作流的邏輯結構
簡單來說,扣子工作流是一個有唯一輸入和唯一輸出的有向無環圖。一個工作流是由一系列首尾相連的功能節點構成的,如圖4-1所示。工作流的核心在于節點,節點是一個具有特定功能的獨立模塊,代表一個獨立的步驟或邏輯。這些節點負責處理數據、執行任務和運行算法,并且它們都具備輸入和輸出。每個工作流都默認包含一個開始節點和一個結束節點。
圖4-1 ?扣子工作流的邏輯結構
除了開始節點和結束節點是每個工作流中固定且唯一的節點之外,其他節點都可以任意添加。最簡單的工作流可以只有一個開始節點和一個結束節點。開始節點是工作流的起始節點,定義啟動工作流所需的輸入參數。開始節點默認有一個輸入參數 input,表示用戶在本輪對話中輸入的原始內容。結束節點是工作流的最終節點,用于返回工作流運行后的結果。結束節點支持兩種返回方式:返回變量和返回文本。
通過引用節點的輸出,你可以將節點連接在一起,形成一個無縫的操作鏈。例如,你可以在代碼節點的輸入中引用大模型節點的輸出,這樣代碼節點就可以使用大模型節點的輸出。在工作流編輯頁面中,你可以看到這兩個節點是連接在一起的。創建工作流就像搭積木,不同的積木(節點)可以自由組合,搭建成不同的形狀(功能)。將一個任務分解為多個子任務,每個子任務對應一個節點,通過數據流將這些節點鏈接起來,便形成了工作流。
比如下圖就是一個簡單的工作流,包括3個節點:開始節點、大模型節點和結束節點。