怎樣提取WPS文檔的目錄(智能識別目錄)?
1. 將你的WPS文檔打開,菜單:文件:輸出為PDF,另存為(.pdf)
2.?PyPDF2 從PDF文件中提取目錄
? 運行 python pdf_read_dir.py 你的PDF文件
? 或者?java : pdfbox 讀取 PDF文件內書簽
? ?會生成 書的目錄.txt
3.生成的 書的目錄.txt 編碼:GBK,推薦用 Notepad++ 轉換為編碼:UTF-8。
? ?書的目錄.txt 第一行應該是書名,如果缺少書名就手工添加。
4. 運行 python txt_etree_mm.py ?書的目錄.txt
? 或者運行 note txt_etree_mm.js ?書的目錄.txt
? 會生成 目錄的思維導圖.mm
5. 運行 python txt_xml_etree_htm.py 書的目錄.txt
? 或者運行 node txt_etree_json.js ?書的目錄.txt
? 會生成 書的目錄樹.htm