前言
本文是該專欄的第4篇,后面會持續分享Python辦公自動化干貨知識,記得關注。
在本專欄上一篇文章《Python實現對Word文檔內容出現“重復標題”進行自動去重(3)》中,筆者有詳細介紹使用python對word文檔內容的目標文本進行自動去重。只不過本文要介紹的“去重方法”與上篇介紹的點不一樣,在上一篇文章中,筆者介紹的是“精準去重”。
而本文要介紹的方法,是“將正文標題重復的行,以及標題到該行之間的內容,全部刪除”。如下圖所示:
當我們的目標word文本內容中,出現與標題一樣的內容,想要通過python實現將重復標題與標題之間的數據都刪除,需要怎么做呢?
解決方法,跟著筆者直接往下看正文詳細內容。(附完整代碼)
正文
需求<