[特殊字符] Python 批量合并 Word 表格中重復單元格教程(收貨記錄案例實戰)

在日常辦公中,Word 表格中常出現重復的“供應商名稱”或“物料編碼”,會導致表格冗余且視覺混亂。這時候,用 Python 自動合并重復單元格可以大幅提升表格專業度和可讀性。本篇給大家演示如何用 python-docx 實現該功能。

? 功能概覽

  • 自動讀取 Word 文件中的第一個表格;

  • 檢測指定列中連續重復的單元格;

  • 合并重復項所在區域,留下首行內容;

  • 最終覆蓋內容并保存至新文檔。


🛠? 核心函數:Merge_cells

這個函數可以實現按照列 index 合并 Word 表格中重復值連續區域:

def Merge_cells(table, target_list, start_row, col):"""table       : docx Table 對象(目標表格)target_list : 待處理列值列表,按行順序提取start_row   : 數據開始行,標題行除外,0 為第一行col         : 待合并列的列索引(0 起始)"""start = end = 0reference = target_list[0]for i in range(len(target_list)):if target_list[i] != reference:reference = target_list[i]end = i - 1table.cell(start + start_row, col).merge(table.cell(end + start_row, col))start = end + 1if i == len(target_list) - 1:end = itable.cell(start + start_row, col).merge(table.cell(end + start_row, col))
  • 利用雙指針 startend 識別連續相同內容;

  • cell(...).merge(...) 方法實現合并;

  • 該方法底層調用的是 python-docx 提供的 [Cell].merge() 方法 github.com+5python-docx.readthedocs.io+5stackoverflow.com+5。

?

🔄 完整流程:讀取、合并、覆蓋、保存?

from docx import Documentdoc = Document("收貨記錄.docx")
table = doc.tables[0]# 提取列數據
supplier = [table.rows[i].cells[1].text for i in range(1, len(table.rows)-1)]
pn       = [table.rows[i].cells[2].text for i in range(1, len(table.rows)-1)]# 合并單元格
Merge_cells(table, supplier, start_row=1, col=1)
Merge_cells(table, pn, start_row=1, col=2)# 重寫覆蓋內容以消除合并后空白
for i, row in enumerate(range(1, len(supplier)+1), start=1):table.cell(row, 1).text = supplier[i-1]table.cell(row, 2).text = pn[i-1]doc.save("收貨記錄-合并單元格.docx")
  • table.rows 訪問所有行;

  • 合并執行后,其他重復行內容清空,因此要覆蓋填值;

  • 最終生成文件名帶“合并單元格”的新文檔。

🖼? 結果展示區

?

?

?? 技術詳解 & 注意事項

  1. 合并操作只保留左上單元內容,其他單元秒變空白但保留格式;

  2. python-docx 的 Cell.merge() 接受兩個對角單元格,自動合并區域中所有 cells python-docx.readthedocs.io;

  3. Word 表格支持跨行/跨列合并,merge() 方法基于布局網格處理;

  4. 處理完成后務必覆蓋空白單元格,否則部分數據會丟失;

  5. 可擴展到任意列,只需按 col 參數調用函數。


🧠 總結

功能描述
自動合并自動識別并合并 Word 表格列中連續重復值
覆蓋數據合并后補寫內容,防止空白單元格產生
靈活調用可應用于任意列和場景,支持多列多表操作

這段代碼適用于多情境,如“收貨記錄”“發票匯總”“項目進度表”,省時、高效、美觀。如需支持列樣式統一、支持拆分合并、或加入 progress bar 等功能,都可以繼續擴展和完善,有需要的話隨時告訴我!

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912043.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912043.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912043.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從零構建Node.js服務托管前端項目

下面是一個完整的指南,教你如何從零開始構建一個Node.js服務來托管前端項目,并代理API請求到其他服務器。 1. 項目初始化 # 創建項目目錄 mkdir node-proxy-server cd node-proxy-server# 初始化npm項目 npm init -y# 安裝必要依賴 npm install expres…

Lynx vs React Native vs Flutter 全面對比:三大跨端框架實測分析

一文看懂三大熱門跨端技術的歷史淵源、架構機制、開發體驗、包體積對比與性能評估。 我陪你用實測數據帶你理性選型,不踩坑,不盲信。 1. 框架簡介:它們是誰?來自哪里?干嘛用? 框架名稱所屬公司發布時間初衷…

CKESC的ROCK 180A-H 無人機電調:100V 高壓冗余設計與安全保護解析

一、核心技術參數與性能指標 電壓范圍:支持 12~26S 鋰電(適配 110V 高壓系統)電流特性: 持續工作電流:90A(特定散熱條件)瞬時耐流(1 秒):220A,3 …

優化 ArcPy 腳本性能

使用并行處理 如果硬件條件允許,可以使用 Python 的并行處理模塊(如 multiprocessing)來同時處理多個小任務。這樣可以充分利用多核處理器的優勢,提高腳本的執行效率。 import multiprocessing def process_raster(raster):arcpy…

Windows下CMake通過鴻蒙SDK交叉編譯三方庫

前言 華為鴻蒙官方的文章CMake構建工程配置HarmonyOS編譯工具鏈 中介紹了在Linux平臺下如何使用CMake來配置鴻蒙的交叉編譯環境,編譯輸出在Harmony中使用的第三方so庫以及測試demo。 本文主要是在Windows下實現同樣的操作。由于平臺差異的原因,有些細節…

從C學C++(6)——構造函數和析構函數

從C學C(6)——構造函數和析構函數 若無特殊說明,本博客所執行的C標準均為C11. 構造函數與析構函數 構造函數定義 構造函數是特殊的成員函數,當創建類類型的新對象,系統自動會調用構造函數構造函數是為了保證對象的每個數據成員都被正確初…

清理 Windows C 盤該注意什么

C 盤空間不足會嚴重影響系統性能。 清理 C 盤文件時,首要原則是安全。錯誤地刪除系統文件會導致 Windows 無法啟動。下面我將按照 從最安全、最推薦到需要謹慎操作的順序,為你詳細列出可以清理的文件和文件夾,并提供操作方法。 第一梯隊&…

Python Selenium 滾動到特定元素

文章目錄 Python Selenium 滾動到特定元素?? **1. 使用 scrollIntoView() 方法(最推薦)**🖱? **2. 結合 ActionChains 移動鼠標(模擬用戶行為)**🧩 **3. 使用坐標計算滾動(精確控制像素&…

你寫的 Express 接口 404,可能是被“動態路由”吃掉了

本文首發在我的個人博客:你寫的 Express 接口 404,可能是被“動態路由”吃掉了 前情提要 最近參與公司的一個項目前端 React,后端用的 Express。目前我就做一些功能的新增或者修改。 對于 Express ,本人沒有公司項目實戰經驗&…

【Java面試】你是怎么控制緩存的更新?

🔄 一、數據實時同步失效(強一致性) 原理:數據庫變更后立即失效或更新緩存,保證數據強一致。 實現方式: Cache Aside(旁路緩存): 讀流程:讀緩存 → 未命中則…

react-嵌套路由 二級路由

什么是嵌套路由? 在一級路由中又內嵌了其他路由,這種關系就叫做嵌套路由,嵌套至一級路由內的路由又稱作二級路由 嵌套路由配置 實現步驟 配置二級路由 children嵌套 import Login from "../page/Login/index"; import Home from …

【CMake基礎入門教程】第八課:構建并導出可復用的 CMake 庫(支持 find_package() 查找)

很好!我們進入 第八課:構建并導出可復用的 CMake 庫(支持 find_package() 查找)。 🎯 本課目標 你將掌握: 如何構建一個庫并通過 install() 導出其配置; 如何讓別人在項目中使用 find_package…

Jenkins與Kubernetes深度整合實踐

采用的非jenkins-slave方式 jenkins配置: Jenkins添加k8s master節點的服務器信息 在Jenkins容器內部與k8s master節點設置免費登錄 # docker過濾查詢出運行的Jenkins服務 $ docker ps | grep jenkins# 進入Jenkins容器內部 $ docker exec -it jenkins-server /bi…

GraphQL API-1

簡介 判斷GraphQL方式 判斷一個網站是否使用了GraphQL API,可以通過以下幾種方法: 1. 檢查網絡請求 查看請求端點 GraphQL 通常使用單一端點,常見路徑如: /graphql/api/graphql/gql/query 觀察請求特征 POST 請求為主&…

推薦C++題目練習網站

LeetCode LeetCode是一個全球知名的編程練習平臺,提供大量C題目,涵蓋數據結構、算法、系統設計等。題目難度從簡單到困難,適合不同水平的學習者。平臺支持在線編寫代碼并即時運行測試,提供詳細的題目討論區和官方解答。 Codeforc…

Spring Cloud 微服務(服務注冊與發現原理深度解析)

📌 摘要 在微服務架構中,服務注冊與發現是整個系統運行的基礎核心模塊。它決定了服務如何被定位、調用和管理。 本文將深入講解 Spring Cloud 中 Eureka 的服務注冊與發現機制,從底層原理到源碼分析,再到實際開發中的最佳實踐&a…

【Linux 設備模型框架 kobject 和 kset】

Linux 設備模型框架 kobject 和 kset 一、Linux 設備模型概述二、kobject 與 kset 的核心概念1. kobject2. kset3. 關鍵數據結構 三、kobject 與 kset 的實現源碼四、源碼解析與使用說明1. kset 的創建與初始化2. kobject 的創建與屬性3. sysfs 屬性操作4. 用戶空間訪問示例 五…

一起學前端之HTML------(1)HTML 介紹

HTML 介紹 HTML 即超文本標記語言(HyperText Markup Language),它是構成網頁的基礎技術之一。HTML 借助各種標簽(Tag)對網頁的結構與內容加以描述。下面為你介紹其核心要點: 關鍵特性 標簽結構&#xff…

整體遷移法遷移 Docker 鏡像

docker添加了新的鏡像數據盤,數據盤遷移步驟 使用整體遷移法遷移 Docker 鏡像后,可以在確認遷移成功且新數據盤正常使用后,刪除舊數據目錄來釋放空間1。 # 停止 Docker 服務 sudo systemctl stop docker # 停止 socket 監聽器 sudo systemct…

智能IDE+高效數據采集,讓數據獲取接近0門檻

亮數據也有了自己的官方賬號,大家可以關注:https://brightdata.blog.csdn.net/ 現在正有福利,有興趣的伙伴可以訪問鏈接: https://www.bright.cn/products/web-scraper/?utm_sourcebrand&utm_campaignbrnd-mkt_cn_csdn_jhx…