一、GcPDF 產品簡介
GcPDF(GrapeCity Documents for PDF)是葡萄城(GrapeCity)推出的一款功能強大的 .NET PDF 開發組件,旨在為開發人員提供高效、靈活的 PDF 文檔處理解決方案。無論是創建全新 PDF 文檔、編輯現有 PDF 內容,還是進行 PDF 轉換、批注、簽名、表單處理等操作,GcPDF 均能通過簡潔易用的 API 實現,廣泛適用于企業級報表生成、文檔管理系統、電子合同簽署、金融票據處理等各類業務場景。
作為 .NET 生態下的成熟 PDF 組件,GcPDF 具備跨平臺特性,支持 .NET Framework、.NET Core、.NET 5+ 及以上版本,可在 Windows、Linux、macOS 等操作系統中穩定運行,同時兼顧高性能與低內存占用,能輕松應對大規模 PDF 文檔的批量處理需求,幫助開發團隊快速構建專業的 PDF 相關應用。
二、GcPDF V8.2 新特性:AI 驅動的 PDF 處理
V8.2 版本新增了功能強大的軟件包 GcPDF AI ,該軟件包旨在展示 GcPDF 如何與 AI 服務集成,進而優化 PDF 文檔工作流程。借助此特性,開發人員可利用 OpenAI 或 Azure OpenAI 直接從 PDF 中生成摘要、創建大綱樹,并提取結構化表格數據。
支持的場景
目前,GcPDFAI 支持以下三種由 AI 驅動的 PDF 處理功能:
-
生成文檔摘要 - 快速生成任意 PDF 文檔的簡短或詳細摘要。
-
可在 C# 或 VB 語言中通過編程方式,利用 GcPDFAI 生成 PDF 文檔摘要。
-
構建文檔大綱樹 - 自動生成結構化目錄,并包含嵌套大綱層級。
-
借助 .NET PDF API 中集成的 AI 功能,自動生成結構化目錄。
-
從文檔中提取表格 - 通過自然語言提示,從 PDF 中識別并提取表格數據。
-
利用 PDF API 的 AI 功能從 PDF 中提取表格。
上述功能均基于 OpenAI Chat API 構建,支持通過兩種方式連接:一是通過官方 OpenAI .NET 客戶端庫,二是通過 Azure OpenAI 服務。
API 概述
該新軟件包包含兩個主要類,二者均繼承自同一個用于實現核心功能的基類:
- OpenAIDocumentAssistant:通過官方 .NET 客戶端庫連接至 OpenAI REST API。
- AzureOpenAIDocumentAssistant:通過 Azure.AI.OpenAI 軟件包連接至 Azure OpenAI 服務。
這兩個類均派生自 OpenAIDocumentAssistantBase 基類,該基類實現了兩項關鍵邏輯:一是通過 Page.GetText() 方法提取文本,二是將內容發送至 AI 服務進行處理。其中,pageRange 參數允許開發人員將請求范圍限定在 PDF 的特定章節。
以下代碼示例展示了如何在 GcPDF 中實現人工智能驅動的功能:
支持的平臺
- OpenAI REST API(通過官方 .NET 客戶端連接)
- Azure OpenAI 服務(通過 Azure.AI.OpenAI 軟件包連接)