【分享成果,隨喜正能量】時光綻放并蒂蓮,更是一份殷殷囑托,更是一份誠摯祝福,是一份時光饋贈,又是一份時光陪伴。。
我的教程一共九套及VBA漢英手冊一部,分為初級、中級、高級三大部分。是對VBA的系統講解,從簡單的入門,到數據庫,到字典,到高級的網抓及類的應用。大家在學習的過程中可能會存在困惑,這么多知識點該如何組織成自己的程序呢?VBA可否能組織一個大型的程序呢?如何讓VBA形成一個工具,拿來就用呢?在我的教程完結后,我陸續推出這類技術工具資料,這類工具整合了若干多的VBA知識點,讓大家感受到VBA之強大。工具資料共兩個系列,一個是YZ系列,一個是NZ系列。今日給大家介紹的是NZ系列工具NZ02:VBA讀取PDF使用說明
NZ02 VBA讀取PDF使用說明
PDF文件大家并不陌生,很多資料的傳遞都是依靠這種文件格式進行,如一些報表,合同書,甚至個人的一些資料。這個格式的文件有著自己的特點,不易被修改,但是我們的一些數據信息往往來自于這類文件,那么怎么利用VBA技術讀取把這類文件的信息呢?這個應用就是實現這個目的。提供給學員7項功能:
功能1:在指定路徑下的PDF中查找字符串;
功能2:將指定路徑下的PDF文件拆分成若干個文件,每個文件的頁數是指定的;
功能3:將某個文件夾下的多個pdf文件合并,
功能4:提取pdf文件中表的數據,表中不能有合并單元格,
功能5:提取PDF中某個段落數據到EXCEL
功能6:提取pdf文件中表的數據,表中可以有合并單元格
功能7:將文件夾下的多個PDF轉變成WORD文件,并放在同路徑下的WORD文件夾下(事前建立)
一準備工作
當你得到這個應用技術后,可以看到兩個文件夾及一個使用的文檔說明。
1我們首先打開“adobeacrobatXpro_setup”文件夾,安裝一下ADODB,這個文件夾下有安裝的說明,如果按照過程出現異常,按照這個說明進行處理即可。安裝ADODB的目的是要獲得VBA中利用的控件。
2安裝好后,我們打開“程序及示例文件文件”這個文件夾,這個文件如下截圖:
這個文件夾中包含兩個文件夾和兩個文件,其中“word”文件夾是空的,用于文檔裝換后的目的地址;“測試文檔”中包含我們可以用于測試各個功能的PDF文件;PDFChangeTo.xlam文件是加載項文件,是整個文件的技術核心部分,如果您得到的是不開放源碼的資料,您是無法打開這個文件并看到代碼的,如果您得到的是開放源碼的資料,可以輸入密碼“123456789”打開這個加載項,并看到里面的代碼,但是建議您不要輕易打開。TestPDFChangeTo.xlsm文件是我們應用這個加載項的程序,提供了應用的界面,我們打開這個文件,截圖如下:
以上的界面截圖提供了各項功能的運行按鈕及要提供的輸入參數。您只要在這個界面中按照要求輸入相應的參數就可以了。
二功能1:在指定路徑下的PDF中查找字符串
測試參數輸入,在D2單元格中輸入路徑地址“D:\VBA筆記\VBA_PDF\程序及示例文件文件\測試文檔”;在E2單元格中輸入文件名search;在F2單元格中輸入我們要查找的字符。
點擊運行按鈕mynzTestA.
結果:
三功能2:拆分PDF文件
測試參數輸入,在D4單元格中輸入路徑地址:D:\VBA筆記\VBA_PDF\程序及示例文件文件\測試文檔;在E4單元格中輸入文件名”Fiddler調試”;在F4單元格中輸入我們要形成每個文件的頁數,這里我們選擇10。
點擊運行按鈕mynzTestB.
結果:
以上我們看到,已經將”Fiddler調試文件,分隔成每10頁一個文件,運行也是非常的快。
四功能3:將某個文件夾下的多個pdf文件合并
測試參數輸入,在D6單元格中輸入路徑地址:D:\VBA筆記\VBA_PDF\程序及示例文件文件;在E6單元格中輸入文件名”myMergePDF”;在F6單元格為空,沒有參數。如下截圖:
點擊運行按鈕mynzTestC.
結果:
以上結果,已經將“search文件”和“文章”文件合并到“myMergePDF”文件。當然,你也可以在這個文件夾下放入多個PDF文件。
五功能4:提取pdf文件中表數據(表中不能有合并單元格)
測試參數輸入:在D8單元格中輸入路徑地址“D:\VBA筆記\VBA_PDF\程序及示例文件文件\測試文檔”;在E8單元格中輸入文件名”myPDF(無合并單元格)”;在F8單元格為空,沒有參數。如下截圖:
點擊運行按鈕mynzTestD.
結果:
程序運行后,會形成一個新的文件,把表格中的內容放到新的工作簿文件中。
六功能5:提取PDF中某個段落數據到EXCEL
測試參數輸入:在D10單元格中輸入路徑地址“D:\VBA筆記\VBA_PDF\程序及示例文件文件\測試文檔”;在E10單元格中輸入文件名“文章”;在F8單元格輸入“要提取的段落號”這里我們輸入1。如下截圖:
點擊運行按鈕mynzTestE.
結果:
程序運行后,會形成一個新的文件,把PDF文件“文章”中的第一段內容放到新的工作簿文件中。
七功能6:提取pdf文件中表的數據(可以有合并單元格)
測試參數輸入:在D12單元格中輸入路徑地址“D:\VBA筆記\VBA_PDF\程序及示例文件文件\測試文檔”;在E12單元格中輸入文件名“myPDF(有合并單元格)”;在F12單元格輸入表間隔參數,是指兩個表的間隔行數,這里用的是3。如下截圖:
點擊運行按鈕mynzTestF.
結果:
程序運行后,會形成一個新的文件,把PDF各個表格中的內容放到新的工作簿文件中。
八功能7:將文件夾下的多個PDF轉變成WORD文件
測試參數輸入:在D14單元格中輸入路徑地址“D:\VBA筆記\VBA_PDF\程序及示例文件文件”;沒有其他參數,如下截圖:
點擊運行按鈕mynzTestG.
結果:
程序運行后,會在word文件夾中形成相應新的word文件.
九技術總結
這個應用中,我們大體上解決了VBA讀取PDF文件中常見的七大問題:
功能1:在指定路徑下的PDF中查找字符串;
功能2:將指定路徑下的PDF文件拆分成若干個文件,每個文件的頁數是指定的;
功能3:將某個文件夾下的多個pdf文件合并,
功能4:提取pdf文件中表的數據,表中不能有合并單元格,
功能5:提取PDF中某個段落數據到EXCEL
功能6:提取pdf文件中表的數據,表中可以有合并單元格
功能7:將文件夾下的多個PDF轉變成WORD文件,并放在同路徑下的WORD文件夾下(事前建立)
但是,由于有些PDF的文件完全完美的讀取對于VBA而言是非常困難的,還不能夠完全實現,也希望學員的技術在我的基礎上有所突破,
【分享成果,隨喜正能量】
下面是NZ系列VBA應用工具: