在現代軟件開發中,處理文檔內容是一個非常常見的需求。無論是生成報告、存儲日志,還是處理用戶輸入,開發者都可能需要在純文本與 Word 文檔之間進行轉換。
- 有時需要將文本轉換為 Word,以便生成結構化的
.docx
文件,使內容更易于閱讀、打印或分享。 - 有時需要將 Word 文檔轉換為文本,以便進行內容分析、搜索索引或數據處理。
通過掌握這兩種轉換方法,開發者可以更高效地處理各種文檔場景,提高應用程序的靈活性。
本文將介紹如何使用 Free Spire.Doc for .NET 在 C# 中完成以下操作:
- 將文本字符串轉換為 Word 文檔
- 將文本文件轉換為 Word 文檔
- 將 Word 文檔轉換為文本文件
前提條件
- 開發環境:Visual Studio 或任意 C# IDE
- 庫:Free Spire.Doc for .NET
可以通過 NuGet 安裝 Free Spire.Doc:
Install-Package?FreeSpire.Doc
提示:Free Spire.Doc 適合基本文檔處理需求(每個文檔不超過500個段落和25個表格),如果需要處理更大的文檔,可選擇商業版本。
在 C# 中將文本轉換為 Word
處理純文本時,通常有兩種情況:
- 文本已經在內存中,例如來自用戶輸入或程序生成的字符串。
- 文本存儲在
.txt
文件中,需要將其轉換為 Word 文檔。
將文本字符串轉換為 Word
using?Spire.Doc;
using?Spire.Doc.Documents;class?Program
{static?void?Main(){Document?document?=?new?Document();Section?section?=?document.AddSection();Paragraph?paragraph?=?section.AddParagraph();paragraph.AppendText("這是一個將文本字符串轉換為?Word?的示例。");document.SaveToFile("TextStringToWord.docx",?FileFormat.Docx);}
}
說明:
Document
用于創建 Word 文檔對象。Section
和Paragraph
是 Word 文檔結構的基本單元,可以根據需要添加多段文本或設置段落格式。- 輸出文件
TextStringToWord.docx
將包含插入的文本內容。
擴展技巧:如果需要對文本應用不同字體、顏色或樣式,可以使用
TextRange
對象進一步設置。
將文本文件轉換為 Word
using Spire.Doc;namespace ConvertTextToWord
{internal class Program{static void Main(string[] args){// 創建Document類的對象Document doc = new Document();// 加載文本文件doc.LoadText("示例.txt");// 將文本文件保存為Worddoc.SaveToFile("Txt轉Word.docx", FileFormat.Docx2016);doc.Close();}}
}
說明:
- LoadText 用于加載文本文件。
- SaveToFile 將文本文件保存為Word文件,可選Doc, Docx等多種格式。
在 C# 中將 Word 轉換為文本
有時我們需要從 Word 文檔中提取內容用于分析或存儲。這種情況下,可以將 Word 文檔導出為純文本文件:
using?Spire.Doc;class?Program
{static?void?Main(){Document?document?=?new?Document();document.LoadFromFile("Sample.docx");//?保存為純文本文件document.SaveToFile("WordToText.txt",?FileFormat.Txt);}
}
說明:
- 此操作會去除 Word 文檔的格式,只保留文本內容。
- 導出的文本可用于全文搜索、日志分析或進一步處理。
- 如果需要保留某些簡單格式(如換行或段落分隔),可在保存前手動遍歷段落進行處理。
總結與建議
通過掌握文本與 Word 之間的雙向轉換,開發者可以:
- 提高文檔處理效率:將生成的文本內容快速轉換為可打印或可分享的 Word 文檔。
- 便于數據分析:從 Word 文檔中提取文本,用于搜索、索引或統計。
- 保持格式靈活性:根據需要對段落、字體或樣式進行自定義。
掌握這些方法后,C# 應用就可以更靈活地處理不同來源和類型的文檔內容。