Php流式 大文件,如何使用PHP解析XML大文件

如果使用 PHP 解析 XML 的話,那么常見的選擇有如下幾種:DOM、SimpleXML、XMLReader。如果要解析 XML 大文件的話,那么首先要排除的是 DOM,因為使用 DOM 的話,需要把整個文件全部加載才能解析,效率堪憂,相比較而言,SimpleXML 和 XMLReader 更好些,SimpleXML 相對簡單,而 XMLReader 相對復雜,但是它可以自定義解析整個過程,特別是流式解析的特點讓其效率更高。

下面我以一個 XML 大文件例子來對比一下 SimpleXML 和 XMLReader 的用法:

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

先看看用 SimpleXML 的話怎么搞:

$values = simplexml_load_file('file.xml');

foreach ($values as $value) {

var_dump($value);

}

?>

在看看用 XMLReader 的話怎么搞:

$xml = new XMLReader();

$xml->open('file.xml');

for ($name = null, $value = []; $xml->read(); null) {

if ($xml->nodeType == XMLReader::ELEMENT) {

$name = $xml->name;

if ($name == 'certificate') {

if ($value) {

var_dump($value);

}

$value = [];

continue;

}

}

if ($xml->nodeType == XMLReader::TEXT) {

if ($name) {

$value[$name] = $xml->value;

}

}

}

?>

在本例中,XML 文件有幾百萬行,XMLReader 的效率是 SimpleXML 的兩倍左右。

了解了相關知識,讓我們看看如何選擇合適的 XML 解析方法:如果規則比較復雜的話, 比如要查詢當前節點的上下文,那么 DOM 是合理的選擇;如果 XML 體積比較大的話,那么 XMLReader 是效率更高。不過如果沒有特殊需求的話,那么盡量選擇 SimpleXML,畢竟它用起來更簡單。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/370237.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/370237.shtml
英文地址,請注明出處:http://en.pswp.cn/news/370237.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python 白盒測試_白盒測試教程 - 顏麗的個人空間 - OSCHINA - 中文開源技術交流社區...

總共貼了39節,后續還有很長,共122節,文章名為‘白盒測試教程’1、白盒測試概念2、測試覆蓋標準3、邏輯驅動測試4、基本路徑測試白盒測試概念1、白盒測試也稱結構測試或邏輯驅動測試,是一種測試用例設計方法,它從程序的…

Oracle 分析函數及常用函數

什么叫分析函數(Analytic function)? Oracle從8.1.6開始提供分析函數,分析函數用于計算基于組的某種聚合值,它和聚合函數的不同之處是 對于每個組返回多行,而聚合函數對于每個組只返回一行。 基本語法 function_name(arg1,arg2,..…

ScanTailor-ScanTailor 強大的多方位的滿足處理掃描圖片的需求

ScanTailor 強大的多方位的滿足處理掃描圖片的需求ScanTailor 能做什么?批量或單張或選擇區間旋轉圖片自動切割頁面,同時提供手動選項自動識別圖像歪斜角度,同時提供手動選項自動識別正文內容裁剪,同時提供手動選項設置正文上下左…

使用JavaCV進行手和手指檢測

這篇文章是Andrew Davison博士發布的有關自然用戶界面(NUI)系列的一部分,內容涉及使用JavaCV從網絡攝像頭視頻提要中檢測手。 注意:可以從http://fivedots.coe.psu.ac.th/~ad/jg/nui055/下載本章的所有源代碼。 第5章的彩色斑點檢…

oracle+trace參數設置,Oracle autotrace參數詳解

SQL> set autotrace traceonly explainSP2-0613: 無法驗證 PLAN_TABLE 格式或實體cuug每周五晚8點都有免費網絡課程,如需了解可點擊cuug官網。SP2-0611: 啟用EXPLAIN報告時出錯解決方法:1. 以SYS用戶登錄CONNECT / as SYSDBA ;1. 創建PLAN_TABL…

git提交代碼到碼云

日常代碼一般提交到github比較多,但我還是鐘愛馬爸爸,沒錯就是碼云。 碼云是中文版的代碼托管的網站,不存在打開網速問題,使用也蠻方便的,日常自己保存托管代碼已經足夠,平時使用git提交代碼到碼云是非常方…

不能裝載文檔控件。請在檢查瀏覽器的選項中檢查瀏覽器的安全設置_【2020年網絡安全宣傳周】如何正確設置瀏覽器...

李夏是一個公司的職員,一天晚上加班趕制文檔,由于要向客戶匯報產品情況,需要獲取大量網上信息,然而在制作中卻發現瀏覽器的網頁打不開了。第二天原計劃向客戶展示的材料未能完整匯總,客戶見面對接效果也打了折扣。在當…

矩形碰撞檢測和圓形碰撞檢測。

矩形碰撞檢測&#xff1a; <!DOCTYPE html><html lang"en"><head><meta charset"UTF-8"><title>Document</title><style type"text/css">body { margin: 0;}#wrap { margin: 50px auto; position: re…

MonogoDB 查詢小結

MonogoDB是一種NoSQL數據庫 優點: 1.數據的存儲以json的文檔進行存儲(面向文檔存儲) 2.聚合框架查詢速度快 3.高效存儲二進制大對象 缺點: 1.不支持事務 2.文件存儲空間占用過大 案例學習 例1:單個變量查詢(查找出制造商字段為“Porsche”的所有汽車的查詢) {"layout"…

用裝飾器設計模式裝飾

裝飾圖案是廣泛使用的結構圖案之一。 此模式在運行時動態更改對象的功能&#xff0c;而不會影響對象的現有功能。 簡而言之&#xff0c;此模式通過包裝將附加功能添加到對象。 問題陳述&#xff1a; 想像一下我們有一個比薩餅&#xff0c;該比薩餅已經用番茄和奶酪烤制的情況。…

linux 內存強度測試軟件,linux下的CPU、內存、IO、網絡的壓力測試工具與方法介紹...

使用工具stressCentos# yum -y install stressUbantu# apt-get install stress# stress --helpstress imposes certain types of compute stress on your systemUsage: stress [OPTION [ARG]] ...-?, --help show this help statement--version show version statement-v, --v…

vcpkg安裝_微軟牌包管理器vcpkg更新及路線圖計劃

蝎子vcpkg是一套跨平臺&#xff0c;開源的C/C庫管理器&#xff0c;今天的這篇文章是有關vcpkg主題的2020年4月博文更新。在這篇文章中&#xff0c;我們將分享有關vcpkg 2020.04發布版本的一些信息以及vcpkg的路線圖(roadmap)&#xff0c;我們會在這里持續地發布有關vcpkg的最新…

CSS 盒模型與box-sizing

一、盒模型 一個web頁面由許多html元素組成&#xff0c;而每一個html元素都可以表示為一個矩形的盒子&#xff0c;CSS盒模型正是描述這些矩形盒子的存在。 MDN的描述&#xff1a; When laying out a document, the browsers rendering engine represents each element as a r…

Java課程設計 購物車系統(個人博客) 201521123052 藍錦明

1. 團隊課程設計博客鏈接 課程設計團隊博客 2. 個人負責模塊或任務說明 &#xff08;1&#xff09;制作圖形菜單引導界面 &#xff08;2&#xff09;定義各獲取和輸出類函數 3. 自己的代碼提交記錄截圖 4. 自己負責模塊或任務詳細說明 import java.text.NumberFormat; public c…

7-12(圖) 社交網絡圖中結點的“重要性”計算(30 分)

在社交網絡中&#xff0c;個人或單位&#xff08;結點&#xff09;之間通過某些關系&#xff08;邊&#xff09;聯系起來。他們受到這些關系的影響&#xff0c;這種影響可以理解為網絡中相互連接的結點之間蔓延的一種相互作用&#xff0c;可以增強也可以減弱。而結點根據其所處…

linux系統的安裝程序,Linux系統安裝

為了不影響本機系統&#xff0c;建議在虛擬機上創建并安裝Linux系統&#xff0c;本次安裝centos7 64位的鏡像。詳細步驟如下&#xff1a;1、首先在虛擬機主頁創建新的虛擬機。... 圖1.1 2、選擇自定義安裝&#xff0c;這樣方便我們更好了解虛擬機&#xff0c;然后點擊下一步。.…

REST與Apache Camel

在Camel中公開HTTP終結點的方法有很多&#xff1a;jetty&#xff0c;tomcat&#xff0c;servlet&#xff0c;cxfrs和restlet。 其中的兩個組件– cxfrs和restlet也只需幾行代碼即可支持REST語義。 這個簡單的示例演示了如何使用camel-restlet和camel-jdbc進行CRUD操作。 四個HT…

百米路由器2登陸地址_騰達無線路由器怎么安裝,真的不錯

騰達無線路由器怎么安裝1、WAN口連接寬帶進線(即網絡公司進來的線或貓出來的線&#xff0c;一般顏色不一樣)、LAN口連接局域網內的電腦。2、設置所連接電腦的IP地址。右鍵點擊網上鄰居屬性3、右鍵點擊本地連接屬性4、選擇Internet協議TCP/IP屬性5、點擊選擇自動獲得IP地址和自動…

input點擊鏈接另一個頁面,各種操作。

1.鏈接到某頁<input type"button" name"Submit" value"確 定" class"btn" οnclick"location.hreffilename.html" />2.返回(等同后退)<input name"Submit2" type"button" class"btn"…

80. Remove Duplicates from Sorted Array II

題目描述 Follow up for “Remove Duplicates”: What if duplicates are allowed at most twice? For example, Given sorted array nums [1,1,1,2,2,3], Your function should return length 5, with the first five elements of nums being 1, 1, 2, 2 and 3. It doesn…