[解決方案] Word轉PDF

背景:

之前做過一些pdf導出, 客戶提了一個特別急的需求, 要求根據一個模版跟一個csv的數據源, 批量生成PDF, 因為之前用過FOP, 知道調整樣式需要特別長的時間, 這個需求又特別急, 所以尋找了一個其他的方案。

優點:

生成快捷,代碼簡單, 樣式依賴模版,所見即所得

缺點:

模版難以調整

思路:

既然已經放棄FOP,那么就直接從模版生成新的word文檔, 并且將word文檔直接導出

第一版思路:

<dependency><groupId>org.docx4j</groupId><artifactId>docx4j-core</artifactId><version>8.3.9</version></dependency> <!-- :contentReference[oaicite:0]{index=0} --><!-- 內置 MOXy JAXB 實現 --><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-JAXB-MOXy</artifactId><version>8.3.9</version></dependency> <!-- :contentReference[oaicite:1]{index=1} --><!--    &lt;!&ndash; FO 導出,用于生成 XSL-FO &ndash;&gt;--><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-export-fo</artifactId><version>8.3.9</version></dependency> <!-- :contentReference[oaicite:2]{index=2} -->public static void main(String[] args) throws Exception {// 1. 加載模板InputStream tpl = Word2PDF.class.getResourceAsStream("/template.docx");if (tpl == null) {throw new RuntimeException("未找到模板 template.docx");}//這部分非必須, 是為了多次導出,不重復讀模版byte[] template = tpl.readAllBytes();// 2. 準備多條替換數據List<Map<String,String>> dataList = new ArrayList<>();Map<String,String> maps = new HashMap<>();maps.put("firstName","Alice");maps.put("context","測試測試測試測試測試測試測試測試測試測試測試測試測試測試測試測試測");maps.put("lastName","Wang");maps.put("date","2025-05-20");dataList.add(maps);maps = new HashMap<>();maps.put("firstName","Bob");maps.put("lastName","Li");maps.put("date","2025-05-21");dataList.add(maps);maps = new HashMap<>();maps.put("firstName","Carol");maps.put("lastName","Zhang");maps.put("date","2025-05-22");dataList.add(maps);// 3. 循環生成for (Map<String,String> row : dataList) {// 3.1 重新加載模板WordprocessingMLPackage pkg;try (InputStream tplStream = new ByteArrayInputStream(template)) {pkg = WordprocessingMLPackage.load(tplStream);}// 3.2 執行替換 (${key})MainDocumentPart mdp = pkg.getMainDocumentPart();mdp.variableReplace(row);// 替換 ${firstName}、${lastName}、${date} :contentReference[oaicite:2]{index=2}// 3.3 保存為 DOCXString name = row.get("firstName");String docxPath = "/Users/Documents/" + name + ".docx";pkg.save(new File(docxPath));try(OutputStream os = new FileOutputStream("/Users/Documents/" + name + ".pdf"))  {Docx4J.toPDF(pkg, os);}}}

這種方式全部依賴docx4j的jar包,進行導出。?

缺點, 當模版有復雜模型,比如側邊欄時這種方式是無法導出的, 在網上找到的解決方案也是無效的。可能是因為JDK版本的升級。

版本2:

上面代碼的邏輯一樣,額外使用了documents4j的jar

<dependency><groupId>org.docx4j</groupId><artifactId>docx4j-core</artifactId><version>8.3.9</version></dependency> <!-- :contentReference[oaicite:0]{index=0} --><!-- 內置 MOXy JAXB 實現 --><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-JAXB-MOXy</artifactId><version>8.3.9</version></dependency> <!-- :contentReference[oaicite:1]{index=1} --><!--    &lt;!&ndash; FO 導出,用于生成 XSL-FO &ndash;&gt;--><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-export-fo</artifactId><version>8.3.9</version></dependency> <!-- :contentReference[oaicite:2]{index=2} -->//轉化為PDF的代碼使用//聲明轉換器,可重用
IConverter converter = LocalConverter.builder().baseFolder(new File(targetPath)).workerPool(5,15,30, TimeUnit.SECONDS).processTimeout (60, TimeUnit.SECONDS).build();
//聲明 轉換, 最后一步有schedule excute 兩種寫法, excute是直接生成,結果是boolean,是單條生成的,這種是為了批量運行
Future<Boolean> future = converter.convert(word).as(DocumentType.MS_WORD).to(new File(wordName + ".pdf")).as(DocumentType.PDF).schedule();//對應 schedule的運行
future.get();

這種方式可以達成所見即所得。

PS:

之前提出了模版難以修改,是因為模版中要使用${替換名稱}的方式, 但是word有時會自動截斷一個字符串, 導致實際上變成了${替 換名稱? }的樣式, 需要多改幾次試下,連續輸入試一下。

有一種比較簡單的方式,就是將word文件的后綴名改成zip ,然后拿出document.xml 可以在這個里面直接改,名稱改回后記得打開看是否報錯, 如果報錯,另存一下,就可以去掉報錯。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/83865.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/83865.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/83865.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

01 基本介紹及Pod基礎

01 查看各種資源 01-1 查看K8s集群的內置資源 [rootmaster01 ~]# kubectl api-resources NAME SHORTNAMES APIVERSION NAMESPACED KIND bindings v1 …

19 C 語言位運算、賦值、條件、逗號運算符詳解:涵蓋運算符優先級與復雜表達式計算過程分析

1 位運算符 位運算符是對整數的二進制表示&#xff08;補碼形式&#xff09;進行逐位操作的運算符。以下是主要的位運算符及其功能描述&#xff1a; 運算符描述操作數個數副作用&按位與2無|按位或2無^按位異或2無~按位取反1無<<按位左移2無>>按位右移2無 1.1…

哈希查找方法

已知哈希表長度為11&#xff0c;哈希函數為H&#xff08;key&#xff09;&#xff1d;key&#xff05;11&#xff0c;隨機產生待散列的小于50的8個元素&#xff0c;同時采用線性探測再散列的方法處理沖突。任意輸入要查找的數據&#xff0c;無論是否找到均給出提示信息。 int f…

JavaScript性能優化實戰(10):前端框架性能優化深度解析

引言 React、Vue、Angular等框架雖然提供了強大的抽象和開發效率,但不恰當的使用方式會導致嚴重的性能問題,針對這些問題,本文將深入探討前端框架性能優化的核心技術和最佳實踐。 React性能優化核心技術 React通過虛擬DOM和高效的渲染機制提供了出色的性能,但當應用規模…

類和對象------2

目錄 一. C面向對象模型初探1 .成員變量和函數的存儲 二 this指針1 &#xff09;this指針工作原理2 &#xff09;this指針的使用3&#xff09; const修飾成員函數4 &#xff09;const修飾對象(常對象) 3.友元1 )友元語法2) 課堂練習 4 強化訓練(數組類封裝) 四 運算符重載&…

量子計算在金融科技中的應用前景

隨著量子計算技術的飛速發展&#xff0c;其在各行業的應用潛力逐漸顯現&#xff0c;金融科技領域更是備受關注。量子計算的強大計算能力有望為金融行業帶來前所未有的變革&#xff0c;從風險評估到投資組合優化&#xff0c;從高頻交易到加密技術&#xff0c;量子計算都可能成為…

Redisson 四大核心機制實現原理詳解

一、可重入鎖&#xff08;Reentrant Lock&#xff09; 可重入鎖是什么&#xff1f; 通俗定義 可重入鎖類似于一把“智能鎖”&#xff0c;它能識別當前的鎖持有者是否是當前線程&#xff1a; 如果是&#xff0c;則允許線程重復獲取鎖&#xff08;重入&#xff09;&#xff0c;并…

srs-7.0 支持obs推webrtc流

demo演示 官方教程: https://ossrs.net/lts/zh-cn/blog/Experience-Ultra-Low-Latency-Live-Streaming-with-OBS-WHIP 實現原理就是通過WHIP協議來傳輸 SDP信息 1、運行 ./objs/srs -c conf/rtc.conf 2、obs推流 3、web端播放webrtc流 打開web:ht

面試題——JDBC|Maven|Spring的IOC思想|DI思想|SpringMVC

目錄 一、JDBC 1、jdbc連接數據庫的基本步驟&#xff08;掌握**&#xff09; 2、Statement和PreparedStatement的區別 &#xff08;掌握***&#xff09; 二、Maven 1、maven的作用 2、maven 如何排除依賴 3、maven scope作用域有哪些&#xff1f; 三、Spring的IOC思想 …

從代碼學習數學優化算法 - 拉格朗日松弛 Python版

文章目錄 前言1. 問題定義 (Problem Definition)2. 拉格朗日松弛 (Lagrangian Relaxation)3. 拉格朗日對偶問題 (Lagrangian Dual)4. 次梯度優化 (Subgradient Optimization)5. Python 代碼實現導入庫和問題定義輔助函數:求解拉格朗日松弛子問題次梯度優化主循環結果展示與繪圖…

密碼學實驗

密碼學實驗二 一、實驗目的&#xff08;本次實驗所涉及并要求掌握的知識點&#xff09; 掌握RSA算法的基本原理并根據給出的RSA算法簡單的實現代碼源程序,以及能夠使用RSA對文件進行加密。掌握素性測試的基本原理&#xff0c;并且會使用Python進行簡單的素性測試以及初步理解…

力扣面試150題-- 從中序與后序遍歷序列構造二叉樹

Day 44 題目描述 思路 這題類似與昨天那題&#xff0c;首先來復習一下&#xff0c;后序遍歷&#xff0c;對于后序遍歷每一個元素都滿足以下規律&#xff1a; &#xff08;左子樹&#xff09;&#xff08;右子樹&#xff09;&#xff08;根&#xff09;&#xff0c;那么我們直…

2區組的2水平析因實驗的混區設計

本文是實驗設計與分析&#xff08;第6版&#xff0c;Montgomery著傅玨生譯)第7章2k析因的區組化和混區設計第7.4節的python解決方案。本文盡量避免重復書中的理論&#xff0c;著于提供python解決方案&#xff0c;并與原書的運算結果進行對比。您可以從Detail 下載實驗設計與分析…

反向傳播算法——矩陣形式遞推公式——ReLU傳遞函數

總結反向傳播算法。 來源于https://udlbook.github.io/udlbook/&#xff0c;我不明白初始不從 x 0 \boldsymbol{x}_0 x0?開始&#xff0c;而是從 z 0 \boldsymbol{z}_0 z0?開始&#xff0c;不知道怎么想的。 考慮一個深度神經網絡 g [ x i , ? ] g[\boldsymbol{x}_i, \bold…

2025年PMP 學習二十三 16章 高級項目管理

2025年PMP 學習二十三 16章 高級項目管理 文章目錄 2025年PMP 學習二十三 16章 高級項目管理高級項目管理戰略管理戰略管理的組成要素&#xff1a;企業戰略轉化為戰略行動的階段&#xff1a; 組織戰略類型戰略組織類型組織級項目管理OPM&#xff08;公司項目管理&#xff09; 組…

Journal of Real-Time Image Processing 投稿過程

投稿要求雙欄12頁以內(包括參考文獻)&#xff0c;這個排版要求感覺不是很嚴格&#xff0c;我當時就是用普通的雙欄的格式去拍的版&#xff0c;然后就提交了&#xff0c;也沒單獨去下載模版。 投稿過程 12.12 Submission received 12.12 Submission is under technical check 1…

t檢驗詳解:原理、類型與應用指南

t檢驗詳解&#xff1a;原理、類型與應用指南 t檢驗&#xff08;t-test&#xff09;是一種用于比較兩組數據均值是否存在顯著差異的統計方法&#xff0c;適用于數據近似正態分布且滿足方差齊性的場景。以下從核心原理、檢驗類型、實施步驟到實際應用進行系統解析。 一、t檢驗的…

Web4X·AI實業未來家庭普及產品矩陣

Web4XAI實業未來家庭普及產品矩陣 > 打造一個“AI能干活、人更自由”的超級生活系統&#xff08;web4-web4.0&#xff09; 一、AI生活服務類 1、代表產品&#xff1a; ? AI語音助手&#xff08;對話、提醒、天氣、家庭調度&#xff09; ? AI陪護機器人&#xff08;老…

Centos上搭建 OpenResty

一、OpenResty簡介 OpenResty 是基于 Nginx 的擴展平臺&#xff0c;完全兼容 Nginx 的核心功能&#xff08;如 HTTP 服務和反向代理&#xff09;&#xff0c;同時通過內嵌 LuaJIT 支持&#xff0c;允許開發者用 Lua 腳本靈活擴展業務邏輯。它簡化了動態邏輯的實現。 二、安裝…

項目管理進階:基于IPD流程的項目管理部分問題及建議書【附全文閱讀】

該文檔主要探討了研發項目管理中存在的問題及改進建議。指出項目組織、項目計劃、項目監控等方面存在的問題&#xff0c;并給出了相應的設計要點。建議建立跨部門、全流程的項目計劃體系&#xff0c;加強風險管理&#xff0c;引入科學的估計方法&#xff0c;建立項目歷史數據積…