回顧一下,上篇博客我們學習了 Pandas 的核心數據結構 Series 和 DataFrame。 DataFrame 作為 Pandas 的 “王牌” 數據結構,是進行數據分析的基石。 但 DataFrame 的強大功能,還需要建立在 數據輸入 (Input) 和 數據輸出 (Output) 的基礎上。 數據從哪里來? 分析結果又如何保存? 數據讀取與寫入 (Data I/O) 就是解決這些問題的關鍵環節。
數據 I/O 的重要性:連接數據與分析
在實際數據分析工作中,數據通常存儲在各種 外部數據源 中,例如:
- CSV 文件 (Comma Separated Values): 最常用的表格數據存儲格式之一,以純文本存儲,易于創建和共享。
- Excel 文件 (.xlsx, .xls): 電子表格軟件 Excel 的文件格式,廣泛應用于辦公場景,包含工作表、公式、格式等。
- 文本文件 (.txt): 存儲純文本數據,例如日志文件、配置文件等。
- JSON 文件 (JavaScript Object Notation): 輕量級的數據交換格式,常用于 Web API