一、引言
(一)研究背景
在有限元分析、計算流體力學(CFD)、計算機輔助設計(CAD)等領域,網格文件是描述幾何模型離散化信息的基礎數據載體,包含節點坐標、單元連接關系、物理屬性等關鍵信息。目前,網格文件格式多達數十種(如 VTK、STL、OBJ、ANSYS CDB 等),且分散存儲于 Zenodo、GitHub、Research Data Australia 等開源平臺。
手動獲取與處理這些文件存在顯著痛點:一是跨平臺檢索效率低,科研人員需逐一訪問平臺下載,易遺漏關鍵數據;二是格式兼容性差,不同仿真軟件(如 ANSYS、ABAQUS)生成的文件需專業工具轉換,預處理成本高。
Python 爬蟲技術可實現數據的自動化獲取,而 meshio 庫支持 30 余種網格格式的讀寫與轉換,二者結合可構建 "獲取 - 處理" 一體化工具,顯著提升網格數據的利用效率。
(二)研究現狀
- 網絡爬蟲在數據獲取中的應用:爬蟲技術已廣泛用于學術文獻(如基于 Scrapy 的 PubMed 爬蟲)、氣象數據(如 NOAA 數據集爬取)等