C#語言實現PDF轉Excel

  • 實現效果

  • 第三方庫

ClosedXML

iTextSharp

  • 實現源碼

using System.Text;
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;
using System.Text.RegularExpressions;
using ClosedXML.Excel;namespace PdfToExcel_winform
{public partial class MainForm : Form{public MainForm(){InitializeComponent();}private void Form1_Load(object sender, EventArgs e){DateTime specificDate = new DateTime(9999, 3, 15); // 試用截至日期DateTime currentDate = DateTime.Now; // 獲取當前日期和時間if (specificDate < currentDate){AddTextAndScroll("******************************************************************************");                AddTextAndScroll("==========軟件試用已到期,請聯系軟件開發者授權續期==========");AddTextAndScroll("******************************************************************************");button1.Enabled = false;}}private void textBox1_TextChanged(object sender, EventArgs e){AddTextAndScroll("=================程序開始執行,START=================");string pdfPath = textBox1.Text;using (PdfReader reader = new PdfReader(pdfPath)){StringBuilder text = new StringBuilder();for (int i = 1; i <= reader.NumberOfPages; i++){text.Append(PdfTextExtractor.GetTextFromPage(reader, i));}//    richTextBox1.Text = text.ToString();AddTextAndScroll("文件讀取完成,原始文件信息:\n" + text.ToString());ReadLine(text.ToString(), pdfPath);}}private void button1_Click(object sender, EventArgs e){if (openFileDialog1.ShowDialog() == DialogResult.OK){// 獲取選擇的文件路徑string selectedFilePath = openFileDialog1.FileName;// 處理文件路徑,例如顯示在文本框中或標簽中textBox1.Text = selectedFilePath;}}private void richTextBox1_TextChanged(object sender, EventArgs e){// richTextBox1.ScrollToCaret();}private void AddTextAndScroll(string text){// 添加文本到RichTextBoxrichTextBox1.AppendText(text + Environment.NewLine);// 滾動到RichTextBox的最后richTextBox1.ScrollToCaret();}private void ReadLine(string text, string path){List<Dictionary<string, string>> dataDictionaryList = new List<Dictionary<string, string>>();using (StringReader reader = new StringReader(text.ToString())){string line, line1;while ((line = reader.ReadLine()) != null){if (line.StartsWith(" ") && line.Length > 5){try{//  AddTextAndScroll("11111:" + line);line = Regex.Replace(line, @"\s+", " ");string[] split = line.Trim().Split(" ");AddTextAndScroll("按行提取有用文件內容:" + string.Join(" ", split));line1 = reader.ReadLine();line1 = Regex.Replace(line1, @"\s+", " ");string[] split1 = line1.Trim().Split(" ");AddTextAndScroll("按行提取有用文件內容:" + string.Join(" ", split1));string total = split1.Last();split1 = split1.Take(split1.Length - 1).ToArray();Dictionary<string, string> dataDictionary = new Dictionary<string, string>();//   AddTextAndScroll(" 長度=====:" + split.Length);dataDictionary.Add("no", split[0]);dataDictionary.Add("sum", split[1]);dataDictionary.Add("desc", string.Join(" ", split1));dataDictionary.Add("xh", split[3]);dataDictionary.Add("price", split[5]);dataDictionary.Add("total", total);AddTextAndScroll("行數據處理完成" );dataDictionaryList.Add(dataDictionary);}catch (Exception ex){AddTextAndScroll("程序出錯:" + ex.Message);}}}//調用excel處理邏輯WriteExcel(dataDictionaryList, path);}}private void WriteExcel(List<Dictionary<string, string>> dataDictionaryList, string path){string fileName = System.IO.Path.GetFileNameWithoutExtension(path);string directoryPath = System.IO.Path.GetDirectoryName(path);string excelPath = System.IO.Path.Combine(directoryPath, fileName + ".xlsx");AddTextAndScroll("Excel文件創建完成,文件路徑為:" + excelPath);// 創建一個新的Excel文件using (var workbook = new XLWorkbook()){// 添加一個工作表var worksheet = workbook.AddWorksheet("Sheet1");// 數據填充worksheet.Cell(1, 1).Value = "序號";worksheet.Cell(1, 2).Value = "數量";worksheet.Cell(1, 3).Value = "描述";worksheet.Cell(1, 4).Value = "型號";worksheet.Cell(1, 5).Value = "單價";worksheet.Cell(1, 6).Value = "金額";var dataList = dataDictionaryList.ToArray();for (var i = 0; i < dataList.Length; i++) {//worksheet.Cell(i + 2, 1).Value = Convert.ToInt16(dataDictionaryList[i]["no"]);//worksheet.Cell(i + 2, 2).Value = Convert.ToDouble(dataDictionaryList[i]["sum"]);//worksheet.Cell(i + 2, 3).Value = dataDictionaryList[i]["desc"];//worksheet.Cell(i + 2, 4).Value = dataDictionaryList[i]["xh"];//worksheet.Cell(i + 2, 5).Value = dataDictionaryList[i]["price"];//worksheet.Cell(i + 2, 6).Value = Convert.ToDecimal(dataDictionaryList[i]["total"]);worksheet.Cell(i + 2, 1).Value = dataDictionaryList[i]["no"];worksheet.Cell(i + 2, 2).Value = dataDictionaryList[i]["sum"];worksheet.Cell(i + 2, 3).Value = dataDictionaryList[i]["desc"];worksheet.Cell(i + 2, 4).Value = dataDictionaryList[i]["xh"];worksheet.Cell(i + 2, 5).Value = dataDictionaryList[i]["price"];worksheet.Cell(i + 2, 6).Value = dataDictionaryList[i]["total"];AddTextAndScroll($"第{i+1}行數據寫入Excel表");}AddTextAndScroll("設置Excel表格列寬自適用");worksheet.Columns().AdjustToContents();worksheet.Column(1).Width = 7;// 保存Excel文件workbook.SaveAs(excelPath);}AddTextAndScroll("開始保存Excel文件");AddTextAndScroll("Excel文件保存完成,文件路徑為:" + excelPath);AddTextAndScroll("=================程序執行結束,END=================");}}}

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/77968.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/77968.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/77968.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何將IDP映射屬性添加,到accountToken中 方便項目獲取登錄人信息

? 目標 你想要&#xff1a; 用戶通過 IdP 登錄&#xff08;SAML 或 OAuth2&#xff09;Keycloak 自動將 IdP 返回的屬性&#xff08;如&#xff1a;email、name、role 等&#xff09;映射到用戶賬戶中并把這些屬性加入到用戶登錄返回的 Access Token 中&#xff0c;供業務系…

JSON-RPC遠程控制

文章目錄 &#x1f310; 一、什么是 JSON-RPC&#xff1f;&#x1f4ec; 二、通信過程1?? 客戶端發起請求2?? 服務端處理請求&#xff0c;調用方法&#xff0c;返回結果 &#x1f4d1; 三、重要字段說明&#x1f6e0;? 四、核心函數與概念&#xff08;結合你的代碼&#x…

芝法醬躺平攻略(21)——kafka安裝和使用

本節內容比較初級&#xff0c;故接著躺平攻略寫 一、官網的下載 1.1 下載解壓 首先&#xff0c;去官網下載jar包&#xff0c;放進linux中&#xff0c;解壓到對應位置。 我的位置放在/WORK/MIDDLEWARE/kafka/4.0 1.2 常見配置 # 每個topic默認的分片數 num.properties4 # 數…

AutoSAR從概念到實踐系列之MCAL篇(二)——Mcu模塊配置及代碼詳解(上)

歡迎大家學習我的《AutoSAR從概念到實踐系列之MCAL篇》系列課程,我是分享人M哥,目前從事車載控制器的軟件開發及測試工作。 學習過程中如有任何疑問,可底下評論! 如果覺得文章內容在工作學習中有幫助到你,麻煩點贊收藏評論+關注走一波!感謝各位的支持! 根據上一篇內容中…

easypoi 實現word模板導出

特此非常致謝&#xff1a;easypoi實現word模板 基礎的可以參考上文&#xff1b; 但是我的需求有一點點不一樣。 這是我的模板&#xff1a;就是我的t.imgs 是個list 但是很難過的是easy poi 我弄了一天&#xff0c;我都沒有弄出來嵌套list循環怎么輸出顯示&#xff0c;更難過…

Unity中數據存儲_LitJson

文章目錄 LitJson一&#xff1a;介紹二&#xff1a;特點三&#xff1a;使用四&#xff1a;注意事項 LitJson 一&#xff1a;介紹 LitJson 是一個專為 .NET 設計的輕量級 JSON 處理庫&#xff0c;支持序列化和反序列化 JSON 數據。 二&#xff1a;特點 快速且輕量 無外部依賴…

2025年首屆人形機器人半程馬拉松比賽(附機器人照片)

2025年4月19日&#xff0c;北京亦莊半程馬拉松暨人形機器人半場馬拉松正式開賽&#xff0c;作為全球首屆人形機器人戶外跑步成功舉辦&#xff0c;21.0975公里的戶外路程對人形機器人來講&#xff0c;注定將成為歷史性開篇&#xff0c;如果賽事能夠持續舉辦&#xff0c;那舉辦意…

網絡安全職業技能大賽Server2003

通過本地PC中滲透測試平臺Kali對服務器場景Windows進?系統服務及版本掃描滲透測 試&#xff0c;并將該操作顯示結果中Telnet服務對應的端?號作為FLAG提交 使用nmap掃描發現目標靶機開放端口232疑似telnet直接進行連接測試成功 Flag&#xff1a;232 通過本地PC中滲透測試平臺…

[java八股文][Java基礎面試篇]I/O

Java怎么實現網絡IO高并發編程&#xff1f; 可以用 Java NIO &#xff0c;是一種同步非阻塞的I/O模型&#xff0c;也是I/O多路復用的基礎。 傳統的BIO里面socket.read()&#xff0c;如果TCP RecvBuffer里沒有數據&#xff0c;函數會一直阻塞&#xff0c;直到收到數據&#xf…

Python常用的第三方模塊之【jieba庫】支持三種分詞模式:精確模式、全模式和搜索引擎模式(提高召回率)

Jieba 是一個流行的中文分詞Python庫&#xff0c;它提供了三種分詞模式&#xff1a;精確模式、全模式和搜索引擎模式。精確模式嘗試將句子最精確地切分&#xff0c;適合文本分析&#xff1b;全模式則掃描文本中所有可能的詞語&#xff0c;速度快但存在冗余&#xff1b;搜索引擎…

QT6 源(37):界面組件的總基類 QWidget 的源碼閱讀(下,c++ 代碼部分)

&#xff08;1&#xff09; QT 在 c 的基礎上增加了自己的編譯器&#xff0c;以支持元對象系統和 UI 界面設計&#xff0c;有 MOC 、 UIC 等 QT 自己的編譯器。本節的源代碼里&#xff0c;為了減少篇幅&#xff0c;易于閱讀&#xff0c;去除了上篇中的屬性部分&#xff0c; 上篇…

rabbitmq-spring-boot-start版本優化升級

文章目錄 1.前言2.優化升級內容3.依賴4.使用4.1發送消息代碼示例4.2消費監聽代碼示例4.3 brock中的消息 5.RabbmitMq的MessageConverter消息轉換器5.1默認行為5.2JDK 序列化的缺點5.3使用 JSON 進行序列化 6.總結 1.前言 由于之前手寫了一個好用的rabbitmq-spring-boot-start啟…

git lfs下載大文件限額

起因是用 model.load_state_dict(torch.load())加載pt權重文件時&#xff0c;出現錯誤&#xff1a;_pickle.UnpicklingError: invalid load key, ‘v’. GPT告訴我&#xff1a;你的 pt 文件不是權重文件&#xff0c;而是模型整體保存&#xff08;或根本不是 PyTorch 文件&#…

什么是RAG?RAG的主要流程是什么?

**RAG(Retrieval-Augmented Generation)**是一種結合檢索與生成技術的框架,旨在通過引入外部知識增強生成模型的性能。其核心思想是:在生成文本時,先從外部知識庫中檢索相關信息,再將檢索結果與原始輸入結合,作為生成模型的輸入,從而提升生成內容的準確性、相關性和信息…

【Rust 精進之路之第13篇-生命周期·進階】省略規則與靜態生命周期 (`‘static`)

系列: Rust 精進之路:構建可靠、高效軟件的底層邏輯 作者: 碼覺客 發布日期: 2025年4月20日 引言:讓編譯器“讀懂”你的意圖——省略的藝術 在上一篇【生命周期入門】中,我們理解了生命周期的必要性——它是 Rust 編譯器用來確保引用有效性、防止懸垂引用的關鍵機制。我…

Python爬蟲實戰:獲取xie程網敦煌酒店數據并分析,為51出行做參考

一、引言 伴隨互聯網的飛速發展,在線旅游平臺成為人們出行預訂酒店的重要途徑。xie程網作為國內頗具知名度的在線旅游平臺,存有豐富的酒店信息。借助爬取xie程網的酒店數據并加以深入分析,能夠為用戶提供更為精準的酒店推薦,特別是在旅游旺季,如 51 出行期間。本研究致力…

第二十一講 XGBoost 回歸建模 + SHAP 可解釋性分析(利用R語言內置數據集)

下面我將使用 R 語言內置的 mtcars 數據集&#xff0c;模擬一個完整的 XGBoost 回歸建模 SHAP 可解釋性分析 實戰流程。我們將以預測汽車的油耗&#xff08;mpg&#xff09;為目標變量&#xff0c;構建 XGBoost 模型&#xff0c;并用 SHAP 來解釋模型輸出。 &#x1f697; 示例…

PyMC+AI提示詞貝葉斯項目反應IRT理論Rasch分析籃球比賽官方數據:球員能力與位置層級結構研究

全文鏈接&#xff1a;tecdat.cn/?p41666 在體育數據分析領域不斷發展的當下&#xff0c;數據科學家們致力于挖掘數據背后的深層價值&#xff0c;為各行業提供更具洞察力的決策依據。近期&#xff0c;我們團隊完成了一項極具意義的咨詢項目&#xff0c;旨在通過先進的數據分析手…

【android bluetooth 框架分析 03】【Bta 層詳解 1】【Bluetooth Application Laye 介紹】

藍牙協議棧中 Bluetooth Application Layer&#xff08;藍牙應用層&#xff09;是協議棧核心組成部分&#xff0c;它位于協議棧中間偏上的位置&#xff0c;主要負責將底層 Bluetooth Stack&#xff08;如 L2CAP、AVDTP、RFCOMM、SDP 等&#xff09;與上層 Profile 和 Android F…

單片機獲取真實時間的實現方法

單片機獲取真實時間&#xff08;即當前的年月日、時分秒等&#xff09;通常需要依賴外部時間源或模塊&#xff0c;因為單片機本身沒有內置的實時時鐘&#xff08;RTC&#xff09;功能。 在 C 語言環境下&#xff0c;單片機獲取真實時間通常需要依賴 外部硬件模塊&#xff08;如…