python xpath解析筆記

python xpath解析筆記

web/2025/9/15 20:36:17/文章來源:https://blog.csdn.net/weixin_45339670/article/details/144466256

與bs4的區別

bs4有很多屬性和方法，而xpath只有一個方法，是通過不同的xpath表達式實現很多功能的。

html例子

在這里插入圖片描述

定位

tree.xpath(‘/html/head/title’)

返回列表。

開頭的斜杠表示從根節點遍歷。

中間的斜杠表示層級。（相當于bs4中的>）

如果直接打印：
在這里插入圖片描述
返回的是一個element對象，其中存儲的title標簽對應的文本內容

tree.xpath(‘/html/body/div’)

分析例子，得知返回應該是三個element

在這里插入圖片描述

tree.xpath(‘/html//div’)

兩個杠，代表跨層。（相當于bs4中的空格）
輸出與 tree.xpath(‘/html/body/div’) 相同

tree.xpath(‘//div’)

含義是定位全部div （理解：就是從任意位置開始定位）

tree.xpath(‘//div[@class=“song”]’)

屬性定位。

返回的仍是列表。

想定位下面這個div，發現它有一個屬性 class=song
在這里插入圖片描述

tree.xpath(‘//div[@class=“song”]/p[3]’)

索引定位。

返回仍是列表。

如果定位蘇軾那一行，就是在div的第三個p標簽。

注意：索引從1開始，而不是0開始。

在這里插入圖片描述

取文本

tree.xpath(‘//div[@class=“tang”]/ul/li[5]/a/text()’)

返回列表。

tree.xpath(‘//div[@class=“tang”]/ul/li[5]/a/text()’) [0]就是只有杜牧兩個字了。

在這里插入圖片描述

tree.xpath(‘//li[7]/i/text()’) [0]

如果要定位度蜜月，那么發現它是全文中第七個li標簽。

/text()獲取標簽直系文本內容

tree.xpath(‘//li[7]//text()’) [0]

等價于上面。

//text()獲取標簽所有文本內容

取屬性

tree.xpath(‘//div[@class=“song”]/img/@src’)

在這里插入圖片描述

小結

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/62916.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/62916.shtml
英文地址，請注明出處：http://en.pswp.cn/web/62916.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Q學習（Q-Learning）詳解

Q學習（Q-Learning）詳解

?作者簡介：2022年博客新星第八。熱愛國學的Java后端開發者，修心和技術同步精進。 🍎個人主頁：Java Fans的博客 🍊個人信條：不遷怒，不貳過。小知識，大智慧。 💞當前專欄…

閱讀更多...

樹狀數組詳解

樹狀數組詳解

概述樹狀數組（Binary Indexed Tree，簡稱BIT），是一種數據結構，用于處理區間查詢和更新問題。它是一種可以高效地在對數級別時間復雜度內進行單點更新和區間查詢的數據結構。樹狀數組通常用于解決以下兩類問題&#xf…

閱讀更多...

freeswitch(開啟支持MCU視頻會議,使用mod_av模塊)

freeswitch(開啟支持MCU視頻會議,使用mod_av模塊)

親測版本centos 7.9系統–》 freeswitch1.10.9 本人freeswitch安裝路徑（根據自己的路徑進入） /usr/local/freeswitch/etc/freeswitch場景說明：有些場景想使用視頻會議MCU融合畫面進行開會使用方法：第一步：下載插件 yum install -y epel-release yum install

閱讀更多...

【大數據技術基礎】【記錄Ubuntu 16.04升級到18.04】Ubuntu的一個版本升級到另一個版本

【大數據技術基礎】【記錄Ubuntu 16.04升級到18.04】Ubuntu的一個版本升級到另一個版本

在 Ubuntu 操作系統中進行軟件更新和系統升級 Ubuntu Kylin 16.04 LTS 系統進行系統升級到 Ubuntu 18.04.6 LTS 版本升級提示：系統彈出提示框，告知用戶有新版本的 Ubuntu 可用，詢問用戶是否想要升級。認證窗口：顯示了一個認證…

閱讀更多...

這是一個vue3 + scss的數字滾動效果

這是一個vue3 + scss的數字滾動效果

介紹: 當數字變化時，只改變變化的數字位，其余的不變，可以遞增、遞減、驟變、負數也可以，但是樣式要根據具體的項目需求去改； 效果1、增加數字： 效果2、減少數字： 使用方法： <te…

閱讀更多...

TortoiseGit的下載、安裝和配置

TortoiseGit的下載、安裝和配置

一、TortoiseGit的簡介 tortoiseGit是一個開放的git版本控制系統的源客戶端，支持Winxp/vista/win7.該軟件功能和git一樣不同的是：git是命令行操作模式，tortoiseGit界面化操作模式，不用記git相關命令就可以直接操作，讀…

閱讀更多...

最新版Chrome瀏覽器加載ActiveX控件之Adobe PDF閱讀器控件

最新版Chrome瀏覽器加載ActiveX控件之Adobe PDF閱讀器控件

背景 Adobe PDF閱讀器控件是一個ActiveX控件，用于在Windows平臺上顯示和操作PDF文件。它提供了一系列方法和屬性，可以實現對PDF文件的加載、顯示、搜索、打印、保存等操作。 allWebPlugin中間件是一款為用戶提供安全、可靠、便捷的瀏覽器插件服務的中間件…

閱讀更多...

linux在沒網的情況下如何校驗時間超詳細拿來即用

linux在沒網的情況下如何校驗時間超詳細拿來即用

一、沒有校時服務器的話 1、手動修改 sudo date --set"2024-06-17 13:44:00"二、有校時服務器的話 1、手動校時 ntpdate 14.193.73.22、自動校時寫一個校時服務腳本 14.193.73.2 是校驗時間服務器 #!/bin/sh while true dontpdate 14.193.73.2sleep 5;hwclock…

閱讀更多...

源碼分析之Openlayers中的控件篇Control基類介紹

源碼分析之Openlayers中的控件篇Control基類介紹

概述 Openlayers 中內置了9類控件，這9類控件都是基于Control類，而Control類則是繼承于BaseObject類，如下圖所示： 如上，這9類控件分別是： Attribution：屬性控件FullScreen:全屏控件MousePositi…

閱讀更多...

計算機網絡知識點全梳理（二.HTTP知識點總結）

計算機網絡知識點全梳理（二.HTTP知識點總結）

目錄 HTTP基本概念 HTTP優缺點 HTTP優點（1.1） HTTP缺點 HTTP與HTTPS HTTP 與 HTTPS 的區別 HTTPS 解決 HTTP 的哪些安全問題？ HTTPS 如何解決安全問題？ HTTPS 連接建立的過程： HTTP/1.1、HTTP/2、HTTP/3 演…

閱讀更多...

第P2周：Pytorch實現CIFAR10彩色圖片識別

第P2周：Pytorch實現CIFAR10彩色圖片識別

🍨 本文為🔗365天深度學習訓練營中的學習記錄博客🍖 原作者：K同學啊目標實現CIFAR-10的彩色圖片識別實現比P1周更復雜一點的CNN網絡具體實現 （一）環境語言環境：Python 3.10 編譯器: …

閱讀更多...

Quant connect的優勢和不足,學習曲線難

Quant connect的優勢和不足,學習曲線難

Quant connect的優勢和不足 Quant connect作為一個成熟的算法交易平臺，具有許多優勢，包括： 強大的回測功能：Quant connect提供了豐富的數據源和回測功能，可以對各種交易策略進行全面的回測和分析。容易上手&#xf…

閱讀更多...

深入理解 Ansible Playbook：組件與實戰

深入理解 Ansible Playbook：組件與實戰

目錄 1 playbook介紹 2 YAML語言 2.1語法簡介 2.2數據類型 3 Playbook核心組件 3.1 hosts組件 3.2 remote_user組件 3.3 task列表和action組件 3.4 handlers 3.5 tags組件 3.6 其他組件說明 1 playbook介紹 playbook 劇本是由一個或多個"play"組成的列表。…

閱讀更多...

2024年食堂采購系統源碼技術趨勢：如何開發智能的供應鏈管理APP

2024年食堂采購系統源碼技術趨勢：如何開發智能的供應鏈管理APP

本篇文章，小編將與大家一同探討2024年食堂采購系統的技術趨勢，并提供開發更智能的供應鏈管理APP的策略。一、2024年食堂采購系統的技術趨勢 1.人工智能與機器學習的深度應用在2024年，AI和機器學習在食堂采購系統中的應用將更加普遍。這些…

閱讀更多...

代碼隨想錄-算法訓練營-番外(圖論01:圖論理論基礎,所有可到達的路徑)

代碼隨想錄-算法訓練營-番外(圖論01:圖論理論基礎,所有可到達的路徑)

day01 圖論part01 今日任務:圖論理論基礎/所有可到達的路徑代碼隨想錄圖論視頻部分還沒更新 https://programmercarl.com/kamacoder/圖論理論基礎.html#圖的基本概念 day01 所有可達路徑鄰接矩陣 import java.util.Scanner;import java.util.List;import java.util.ArrayL…

閱讀更多...

系統架構的演變

系統架構的演變

什么是系統架構？ 系統架構是系統的一種整體的高層次的結構表示，它確定了系統的基本組織、組件之間的關系、組件與環境的關系，以及指導其設計和發展的原則。隨著技術的發展和業務需求的增長，系統架構經歷了從簡單到復雜、從集中到…

閱讀更多...

c++總復習

c++總復習

C 中多態性在實際項目中的應用場景圖形繪制系統描述：在一個圖形繪制軟件中，可能有多種圖形，如圓形、矩形、三角形等。這些圖形都有一個共同的操作，比如繪制（draw）。通過多態性，可以定義一個基…

閱讀更多...

pip離線安裝一個github倉庫

pip離線安裝一個github倉庫

要使用pip安裝一個本地Git倉庫，你可以按照以下步驟操作： 確保你已經克隆了Git倉庫到本地。進入倉庫所在的目錄。使用pip安裝。以下是具體的命令： 克隆Git倉庫到本地（替換下面的URL為你的倉庫URL） git clone https…

閱讀更多...

【從零開始入門unity游戲開發之——C#篇04】棧（Stack）和堆（Heap），值類型和引用類型，以及特殊的引用類型string

【從零開始入門unity游戲開發之——C#篇04】棧（Stack）和堆（Heap），值類型和引用類型，以及特殊的引用類型string

文章目錄知識回顧一、棧（Stack）和堆（Heap）1、什么是棧和堆2、為什么要分棧和堆3、棧和堆的區別棧堆 4、總結二、值類型和引用類型1、那么值類型和引用類型到底有什么區別呢？值類型引用類型 2、總結三、特殊的引用類…

閱讀更多...

【C語言實現：用隊列模擬棧與用棧模擬隊列（LeetCode 225 232）】

【C語言實現：用隊列模擬棧與用棧模擬隊列（LeetCode 225 232）】

LeetCode刷題記錄 🌐 我的博客主頁：iiiiiankor🎯 如果你覺得我的內容對你有幫助，不妨點個贊👍、留個評論?，或者收藏?，讓我們一起進步！📝 專欄系列：LeetCode…

閱讀更多...

最新文章