【AI智能體】Dify 搭建業務單據差異核對助手實戰詳解

目錄

一、前言

二、Dify介紹

2.1 Dify 是什么

2.2 Dify 核心特性

2.2.1 Dify特點

2.2.2 Dify 多模型支持

2.2.3 Dify 適應場景

2.2.4 基于Dify 搭建發票識別應用優勢

三、Dify 搭建業務單據核對助手實戰過程

3.1 前置準備

3.1.1 安裝必要的插件

3.2 完整操作步驟

3.2.1 創建一個應用

3.2.2 開始節點增加一個參數

3.2.3 增加第一個大模型節點

3.2.4 增加第二個大模型節點

3.2.5 增加第三個大模型節點

3.2.6 配置結束節點

3.2.7 效果驗證

四、寫在文末


一、前言

隨著AI智能體在很多領域使用的越來越廣泛,并逐漸產生商業價值之后。人們驚訝的發現,一個可以實現商用的業務系統或應用,只需短短幾天,甚至幾小時就可以做出來。有個傳統業務系統開發經驗的同學應該了解,開發一個功能,從產品經理識別需求到最終開發完成上線使用,這個過程是很長的,而且中間可能還涉及到來來回回的反復溝通,會拉長業務最終交付和使用的時間。比如像票據核對這種工作,往往是需要人工參與校對的,比較大程度上需要依賴人力去完成。有了AI大模型+AI智能體之后,即便不是開發工程師,也能基于AI智能體平臺,快速搭建一個簡單的AI應用來驗證效果,從而快速實現業務價值的驗證。本篇以Dify智能體平臺為例進行說明,使用Dify快速搭建一個業務單據自動核對智能助手應用。

二、Dify介紹

2.1 Dify 是什么

Dify 是一個開源大模型應用開發平臺,旨在幫助開發者(智能體應用愛好者)快速構建、部署和管理基于大型語言模型(LLM)的 AI 應用。它提供了一套完整的工具鏈,支持從提示詞工程(Prompt Engineering)到應用發布的全流程,適用于企業級 AI 解決方案和個人開發者項目。

官網入口:Dify: Production-Ready AI Agent Builder

中文站入口:Dify:企業級 AI Agent 開發平臺

2.2 Dify 核心特性

2.2.1 Dify特點

Dify 具備如下核心特點:

  • 可視化編排工作流

    • 通過低代碼界面設計 AI 應用流程,無需深入編程即可構建復雜的 LLM 應用。

    • 支持 對話型(Chat App) 和 文本生成型(Completion App) 應用。

  • 多模型支持

    • 兼容主流大模型 API,如 OpenAI GPT、Anthropic Claude、Cohere、Hugging Face 等。

    • 支持私有化部署的 Llama 2、ChatGLM、通義千問 等開源模型。

  • 靈活的提示詞工程

    • 提供 Prompt 模板、變量插值、上下文管理等功能,優化 AI 輸出效果。

    • 支持 RAG(檢索增強生成),可結合外部知識庫提升回答準確性。

  • 數據管理與持續優化

    • 記錄用戶與 AI 的交互日志,用于分析和迭代改進模型效果。

    • 支持 A/B 測試,對比不同提示詞或模型版本的表現。

  • 企業級功能

    • 支持 多租戶、權限管理,適合團隊協作開發。

    • 可私有化部署,保障數據安全。

2.2.2 Dify 多模型支持

在dify控制臺,內置了非常多大模型可供用戶選擇使用,比如GPT系列,DeepSeek模型、千問系列模型等,基于這些模型,應用開發者可以自由靈活的選擇并使用。

2.2.3 Dify 適應場景

Dify 適用于多種生成式 AI 應用開發場景:

  • 內容創作與生成

    • 自動化生成文章、報告、營銷文案等

    • 結合知識庫實現專業領域內容生成(如法律、醫療文檔)

  • 智能對話系統

    • 構建多輪對話客服機器人、虛擬助手

    • 通過 Agent 框架實現任務分解與工具調用(如搜索、圖像生成)

  • 數據分析與自動化

    • 解讀復雜數據并生成可視化報告

    • 自動化業務流程(如工單處理、郵件回復)

  • 個性化推薦與營銷

    • 基于用戶畫像生成個性化推薦內容。

    • 結合RAG實現精準信息檢索與推送。

2.2.4 基于Dify 搭建發票識別應用優勢

Dify作為領先的AI應用開發平臺,為零代碼/低代碼構建發票識別應用提供了強大支持。Dify通過可視化工作流編排和多模型集成能力,使開發者無需編寫復雜代碼即可構建專業級發票處理應用。

1)Dify構建的發票識別應用為企業解決了以下痛點:

  1. 效率瓶頸:傳統人工錄入方式處理一張發票平均需3-5分鐘,而AI方案可縮短至秒級2

  2. 錯誤率高:手工錄入錯誤率約2-5%,AI識別準確率可達99%以上17

  3. 版式適應差:傳統OCR依賴固定模板,而AI方案能自適應多種發票版式變化4

  4. 成本壓力:企業財務部門50%以上時間耗費在票據處理上,AI自動化可釋放這部分人力7

2)基于Dify 實現一個發票識別應用搭建的關鍵技術流程如下:

  • 多模態模型集成:

    • 支持視覺-語言大模型(VLM)如Qwen-VL、DeepSeek-V2等,能同時處理圖像和文本信息

  • 可視化工作流編排:

    • 通過拖拽節點方式構建復雜處理流程,如"文檔提取→OCR識別→數據驗證→結果輸出"的全自動化流水線

  • 條件分支與邏輯控制:

    • 支持基于發票類型的智能路由,如自動區分增值稅發票、火車票等不同類型并調用相應處理模塊

  • 多模型協同驗證:

    • 可采用多個VLM模型并行識別后比對結果,顯著提升準確率

3)從實際落地案例看,Dify發票識別應用為企業帶來多維度的價值提升:

  1. 效率提升

    1. 單張發票處理時間從人工3-5分鐘縮短至2-10秒

    2. 華為云方案用戶實現"財務審核效率提升90%以上"

    3. 支持批量處理,某電商企業日處理能力從200張提升至10,000+張

  2. 成本節約

    1. 減少70%以上人工審核崗位

    2. 某服裝電商年節省開票成本23.6萬元(人力+稅損)

    3. 按需使用的云資源模式避免硬件過度投資

  3. 風險控制

    1. 自動識別異常發票(如頻繁紅沖、大額整數票)

    2. 稅務合規率從約85%提升至近100%

    3. 避免如"某電商因紅沖率超15%被罰款87萬元"的案例

  4. 業務賦能

    1. 結構化票據數據賦能財務分析(如供應商集中度分析)

    2. API集成能力支持與ERP、報銷系統的深度對接

    3. 某制造企業實現"從識別到入賬全流程自動化"

三、Dify 搭建業務單據核對助手實戰過程

接下來通過一個實際案例應用來演示下如何基于Dify 搭建業務單據核對助手的操作過程。

3.1 前置準備

3.1.1 安裝必要的插件

Dify提為應用開發者提供了眾多大模型可供集成使用,但需要使用者以插件方式安裝并集成進去。在賬戶那里右鍵設置,進入模型供應商設置那里,可以看到有很多大模型可供集成,入口:插件 - Dify

你可以選擇合適的模型供應商進行安裝,比如我這里選擇了DeepSeek ,通義千問大模型,以及國內的硅基流動大模型集成平臺,主要是把對應的模型供應商的apikey配置進去即可。

3.2 完整操作步驟

3.2.1 創建一個應用

如下,創建一個ChatFlow類型的空白應用,填寫應用名稱和描述之后點擊創建

創建完成后,跳轉到下面的流程配置頁面

3.2.2 開始節點增加一個參數

在開始節點增加一個文件類型的變量參數,用于用戶上傳票據文件使用,如下:

添加完成之后,在右側開始節點配置中可以看到這個參數

3.2.3 增加第一個大模型節點

第一個大模型節點通過配置提示詞,從而來提取用戶上傳的票據文件中的內容,參考下面的系統提示詞

請提取這張照片的內容,其中內容格式'發票號碼'、'開票日期'、'出發時間'、'始發站'、'終點站'、'車次'、'票價'、'身份證號'、'姓名'、'電子客票號'、'購買方名稱'、'統一社會信用代碼'字段返回信息,返回的結果以json格式返回

注意這里的大模型選擇具備視覺識別的大模型

同時,將配置節點中的視覺選項勾選上

3.2.4 增加第二個大模型節點

為了達到最后的票據核對效果,這里我們采用兩個大模型節點,而且兩個大模型節點背后配置不同廠商的大模型,如下,第二個大模型使用千問的大模型,也是選擇帶有VL的,系統提示詞與上一個大模型節點配置相同的內容

總的來說,通過添加兩個大模型節點,兩個不同廠商的大模型同時對用戶上傳的同一份票據進行提取,如果最終不同的大模型提取的內容相同,可以判斷識別的就沒問題

3.2.5 增加第三個大模型節點

再增加一個大模型節點,該節點用于收集前2個大模型節點提取到的內容,然后進行對比分析,大模型中配置下面的提示詞,該提示詞以json的結構對大模型的回答進行了約束,并且給出了參考案例,從而更好的輸出結果

{"Role": "JSON 數據對比專家","Profile": {"專長": "精確比較和分析 JSON 數據","經驗": "多年處理各種結構化數據的豐富經驗","技能": ["精準識別差異","使用顏色高亮標注","詳細對比報告生成"]},"Goals": ["逐行比較兩個JSON數據的內容","識別并標記所有存在的差異","使用顏色(紅色)高亮顯示不同之處","生成清晰、易讀的比對結果報告"],"Rules": ["必須逐個鍵值對進行比較,不遺漏任何字段","只標注存在差異的部分,相同的部分保持原樣","使用紅色作為差異標注的唯一顏色","對于數值型差異,需要考慮精度問題","對于字符串差異,需要考慮大小寫和空白字符","保持 JSON 的結構完整性,不改變原有的格式和順序"],"Workflows": ["接收并解析兩個待比對的 JSON 數據","確保兩個 JSON 數據結構一致,如果不一致,報告結構差異","逐一對比每個鍵值對"," - 如鍵不同,標記為新增或缺失"," - 如值不同,使用紅色高亮標注","生成詳細的對比報告,包括:"," - 總體差異統計"," - 每個差異項的具體描述"," - 高亮顯示的 JSON 數據"],"OutputFormat": {"type": "json","structure": {"summary": "總體比對結果摘要","differences": [{"key": "差異字段名","value1": "第一個 JSON 中的值","value2": "第二個 JSON 中的值","highlightColor": "red"}],"highlightedJSON": "包含紅色高亮的完整 JSON 數據"}},"Examples": [{"input": {"json1": {"價稅合計(小寫)": "263.00","收款人": "李華"},"json2": {"價稅合計(小寫)": "213.00","收款人": "王霞"}},"output": {"summary": "發現2處差異","differences": [{"key": "價稅合計(小寫)","value1": "263.00","value2": "213.00","highlightColor": "red"},{"key": "收款人","value1": "李華","value2": "王霞","highlightColor": "red"}],"highlightedJSON": {"價稅合計(小寫)": "<red>263.00</red>","收款人": "<red>王霞</red>"}}}]
}

同時在添加消息那里,添加用戶提示詞,將前面2個大模型提取的票據內容進行匯聚,如下,在用戶消息輸入框中,將前面2個大模型節點的輸出結果展示在里面即可

3.2.6 配置結束節點

在大模型節點3后面增加一個回復節點,輸入變量為大模型3的輸出結果,如下:

3.2.7 效果驗證

上述配置完成后,點擊發布更新

然后點擊預覽,上傳一張本地的票據,這里我選擇本地的一張火車票,然后首先輸入發票識別,可以看到經過執行,發票的信息被提取出來了,同時給出了差異信息的輸出

四、寫在文末

本文通過案例操作演示詳細介紹了如何基于Dify智能體平臺搭建一個業務發票的差異識別助手的詳細過程,希望對看到的同學有用哦,本篇到此結束,感謝觀看!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/94182.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/94182.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/94182.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Centos編譯安裝Python3.10

gcc編譯源碼包 下載python源碼包并解壓 wget https://www.python.org/ftp/python/3.10.18/Python-3.10.18.tgz tar -xf Python-3.10.18.tgz cd Python-3.10.18系統編譯依賴環境安裝 sudo yum install zlib-devel ncurses-devel gdbm-devel nss-devel openssl-devel readline-de…

Maya 3D建模 導入參考圖、鎖定參考圖

1 導入參考圖切換到 前視圖 或者 側視圖 導入 &#xff08;根據參考圖片類別去選擇&#xff09;方法1&#xff1a;視圖--圖像平面--導入圖像方法2&#xff1a;直接點 圖像平面 備注&#xff1a;誤操作導致看不到 解決辦法&#xff1a;顯示--視口 找對應的2 鎖定參考圖目的&…

基于單片機智能加濕器/空氣加濕器

傳送門 &#x1f449;&#x1f449;&#x1f449;&#x1f449;其他作品題目速選一覽表 &#x1f449;&#x1f449;&#x1f449;&#x1f449;其他作品題目功能速覽 概述 基于單片機的智能加濕器通過集成溫濕度傳感器、控制模塊和霧化裝置&#xff0c;實現環境濕度的自…

SNDR:高精度ADC系統的綜合性能標尺

SNDR&#xff1a;高精度ADC系統的綜合性能標尺 一、SNDR的本質定義與理論基礎 信噪失真比(Signal-to-Noise-and-Distortion Ratio) 是評估ADC系統綜合性能的核心指標&#xff0c;定義為信號功率與噪聲及失真功率之和的比值&#xff1a; SNDRdB10log?10(PsignalPnoisePdistorti…

2025年滲透測試面試題總結-31(題目+回答)

安全領域各種資源&#xff0c;學習文檔&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各種好玩的項目及好用的工具&#xff0c;歡迎關注。 目錄 一、代碼審計核心思路&#xff08;261&#xff09; 二、MySQL Getshell前提&#xff08;262&#xff09; …

[創業之路-560]:機械、電氣、自控、電子、軟件、信息、通信、大數據、人工智能,上述技術演進過程

上述關鍵詞反映的技術演進過程可梳理為一條從機械執行到智能決策的遞進式發展主線&#xff0c;各技術領域在不同階段相互滲透、共同推動機器人技術從功能替代向認知革命躍遷。以下是具體演進邏輯與趨勢分析&#xff1a;一、技術演進的三階段遞進機械主導階段&#xff08;工業革…

芋道前端項目部署后刷新 404 的解決辦法(Nginx 配置教程)

很多同學在把 芋道前端項目 部署到服務器后&#xff0c;會遇到一個奇怪的問題&#xff1a; &#x1f449; 項目首頁能正常訪問&#xff0c;但一旦在瀏覽器里手動刷新某個頁面&#xff0c;就會報 404 Not Found 錯誤。 這到底是為什么呢&#xff1f;又該怎么解決呢&#xff1f;下…

更適合后端寶寶的前端三件套之HTML

文章目錄&#x1f4d5;1. HTML基礎??1.1 什么是HTML??1.2 認識HTML標簽??1.3 HTML文件基本結構??1.4 標簽層次結構&#x1f4d5;2. HTML常見標簽??2.1 標題標簽??2.2 段落標簽??2.3 換行標簽??2.4 圖片標簽??2.5 超鏈接標簽??2.6 表格標簽&#x1f4d5;3. …

【JVM內存結構系列】四、不同垃圾回收器與堆內存的適配關系:從分代GC到Region GC

在JVM內存體系中&#xff0c;堆內存的“分代結構”與“對象流轉規則”是通用基礎&#xff0c;但垃圾回收器&#xff08;GC&#xff09;是決定堆內存實際表現的核心變量——不同GC為實現“低延遲”“高吞吐量”等目標&#xff0c;會對堆的劃分方式、對象管理邏輯、參數配置規則進…

Zemax光學設計輸出3D

輸出立體數據文件&#xff08;IGES/STEP/SAT/STL 格式&#xff09;的參數設置界面&#xff0c;各參數含義如下&#xff1a;1. 起始面/終止面&#xff1a;設定要輸出立體數據對應的光學表面范圍&#xff0c;從第 0 個表面到第 9 個表面 &#xff0c;限定參與輸出的光學結構表面區…

模塊測試與低功耗模式全攻略

一、模塊測試流程在測試一個模塊時&#xff0c;建議遵循以下步驟&#xff1a;基本測試&#xff1a;測試該模塊的寄存器讀寫功能是否正常。可以向每個寄存器寫入 0x5A5A 和 0xA5A5&#xff0c;這兩種模式可以覆蓋對寄存器寫入 0 和 1 的情況。進階測試&#xff1a;在基本測試通過…

機器學習實驗三、使用決策樹算法預測泰坦尼克號幸存者

實驗目的1. 掌握特征工程&#xff0c;會進行特征提取與特征選擇&#xff0c;會進行缺失值填充。2. 建立決策樹模型&#xff0c;解決實際問題。3. 會對模型進行調試&#xff0c;能夠繪制并保存決策樹。實驗環境Python 3.7.0&#xff0c;Sklearn &#xff0c;PyCharm實驗原理1、特…

從全棧開發到微服務架構:一次真實的Java面試實錄

從全棧開發到微服務架構&#xff1a;一次真實的Java面試實錄 面試官與應聘者介紹 面試官&#xff1a;李明&#xff0c;某互聯網大廠技術負責人&#xff0c;擅長Java后端、微服務及云原生架構。 應聘者&#xff1a;張偉&#xff0c;28歲&#xff0c;碩士學歷&#xff0c;擁有5年…

新的 Gmail 網絡釣魚攻擊利用 AI 提示注入來逃避檢測

網絡釣魚一直以來都是為了欺騙人們。但在這次活動中&#xff0c;攻擊者不僅瞄準用戶&#xff0c;還試圖操縱基于人工智能的防御系統。 這是我上周記錄的Gmail 網絡釣魚鏈的演變。那次攻擊活動依賴于緊迫性和重定向&#xff0c;但這次引入了隱藏的 AI 提示&#xff0c;旨在混淆…

Restful風格設計

文章目錄什么是Restful風格&#xff1f;RESTful API設計最佳實踐1. URL設計原則2. HTTP狀態碼的正確使用3. 統一的響應格式實際案例&#xff1a;用戶管理系統API總結什么是Restful風格&#xff1f; 我的理解是&#xff1a;Restful是一種基于HTTP協議的架構設計風格&#xff0c…

深入 Glide 圖像變換:自定義效果、GIF處理與組合變換

在 Android 開發中&#xff0c;Glide 的強大不僅在于其高效的加載和緩存能力&#xff0c;更在于其無與倫比的可擴展性&#xff0c;尤其是在圖像處理層面。當內置的 fitCenter() 和 circleCrop() 無法滿足你的設計需求時&#xff0c;自定義 Transformation 便是你的終極武器。本…

數據挖掘 4.8 評估泛化能力

4.8 Estimating Generalization 4.8 評估泛化能力 評估模型的泛化能力如何合理評估模型的泛化能力指導原則 (Guidelines)存在的問題 (Issues)K-fold 交叉驗證&#xff08;Cross-Validation)留一交叉驗證&#xff08;Leave One Out CV&#xff09;(LOOCV)Stratification 分層訓練…

46.【.NET8 實戰--孢子記賬--從單體到微服務--轉向微服務】--擴展功能--集成網關--網關集成日志

本篇文章&#xff0c;我們一起在網關中集成日志功能&#xff0c;我們要在網關中記錄下游微服務出現的異常信息、請求信息以及響應信息。在微服務架構中&#xff0c;網關作為系統的入口&#xff0c;承擔著非常重要的職責。通過在網關層面集成日志功能&#xff0c;我們可以更好地…

使用 FastAPI 的 WebSockets 和 Elasticsearch 來構建實時應用

作者&#xff1a;來自 Elastic Jeffrey Rengifo 學習如何使用 FastAPI WebSockets 和 Elasticsearch 構建實時應用程序。 更多閱讀&#xff1a;使用 FastAPI 構建 Elasticsearch API 想要獲得 Elastic 認證嗎&#xff1f;看看下一次 Elasticsearch Engineer 培訓什么時候開始&…

華為云ModelArts+Dify AI:雙劍合璧使能AI應用敏捷開發

引言:AI應用開發的敏捷化轉型需求 隨著大語言模型(LLM)技術的迅猛發展,企業與開發者對AI應用開發的敏捷化轉型需求日益凸顯,亟需將大模型能力快速轉化為實際業務價值。傳統AI開發模式中,復雜的模型工程化、流程編排和部署維護工作往往需要專業技術團隊支撐,典型痛點包括…