爬蟲案例一

首先我舉一個案例比如豆瓣電影排行榜 (douban.com)這個電影,首先我們進去檢查源代碼

說明源代碼有,說明是服務器渲染,可以直接那html

但是返回的結果是空,所以我們需要在頭里面加上User-Agent

然后可以看到有返回的結果,如果想拿到其中的名字這時候就要用re正則來進行匹配

然后這是自己寫的正則,可能寫的不夠好

結果爬出來了

如果想拿到這3個信息,如何寫呢

這是我寫的re正則,看結果

如果我們像吧他們存放去了,可以導入csv包只是方便分析而已

結果

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/719837.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/719837.shtml
英文地址,請注明出處:http://en.pswp.cn/news/719837.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Docker快速集成minio

拉取鏡像(默認最新的) docker pull minio/minio創建配制和數據映射文件夾(用于將容器內的配置和數據映射到本地) 這邊的路徑可以修改成自己想要的文件夾 mkdir -p /data/minio/{config,data}啟動容器 (這邊啟動容器要保證本地映…

什么是SpringCloud,有哪些組件?

spring Cloud 是基于spring boot的分布式系統開發工具,它提供了一系列開箱即用的,針對分布式系統開發的特性和組件。用于幫助開發人員快速構建和管理云原生應用程序。 Spring Cloud 的主要目標是解決分布式系統中的常見問題,例如服務發現,負載均衡,配置管理,斷路器,消息總…

c++筆記—— AutoBuffer類(opencv)

自動分配緩沖區類 Automatically Allocated Buffer Class. 這個類用于函數和方法中的臨時緩沖區。如果臨時緩沖區通常很小(幾K的內存),但其大小取決于參數,則在堆棧上創建一個小的固定大小數組,并在足夠大時使用它是有…

LabVIEW起重機工作參數遠程監測系統

LabVIEW起重機工作參數遠程監測系統 隨著起重機技術的持續發展,對其工作參數的實時監控需求日益增加。設計了一個基于LabVIEW和TBox的起重機工作參數遠程監測系統,能夠實現起重機工作參數的實時采集、傳輸、解析和顯示,有效提升起重機的性能…

python--開心篇--print--多種多樣的print輸出

文章目錄 名言輸出繞口令輸出《水滸傳》中的梁山好漢輸出軌道交通充值信息輸出對聯字符畫輸出長春地鐵1號線運行圖模擬12306查詢界面模擬企業網站登錄界面 名言 print("& "*15) print("& &") print("& …

發現了一個超級好用的上網神器!但是不知道在哪里有賣······隨身WiFi好評推薦,隨身WiFi好用嗎?

這兩天到一個小地方出差, 走到一個奶茶店附近, 突然老板打電話說一個緊急文件需要我處理, 說實話有點崩潰, 前不著村后不著店的, 我去哪里找網絡辦公 辛虧奶茶店的小姐姐聽到了, 讓我在她店里&#x…

wy的leetcode刷題記錄_Day81

wy的leetcode刷題記錄_Day81 聲明 本文章的所有題目信息都來源于leetcode 如有侵權請聯系我刪掉! 時間:2024-3-4 前言 目錄 wy的leetcode刷題記錄_Day81聲明前言232. 用棧實現隊列題目介紹思路代碼收獲 138. 隨機鏈表的復制題目介紹思路代碼收獲 141. 環形鏈表題…

SUSE 配置防火墻策略

一.獲取目前訪問的接口 suse12sp3 # netstat -tunlp Active Internet connections (only servers) Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name tcp 0 0 127.0.0.1:8005 0.0.0.0:* …

【Bugs】class path resource [xxx.xml] cannot be opened because it does not exist

報錯: 關鍵報錯信息: class path resource [scope.xml] cannot be opened because it does not exist完整報錯信息: 2024-03-01 14:26:58 866 [main] DEBUG org.springframework.context.support.ClassPathXmlApplicationContext - Refres…

Ubuntu的apt、apt-get和apt-cache命令

原文:apt 和 apt-get 之間有什么區別? https://aws.amazon.com/cn/compare/the-difference-between-apt-and-apt-get/ 陳拓轉載,2023/11/23,添加了舉例。 apt 和 apt-get 之間有什么區別? apt 和 apt-get 都是命令行…

【存儲】without SPDK時,fio測試nvme SSD 和HDD對比

先看使用的io調度器是什么,SSD的話最好設置成none。 root@xxx-0010 ~ # cat /sys/block/nvme5n1/queue/scheduler [none] mq-deadline kyber使用fio對nvme SSD和普通HDD做對比測試: 1、 4K random write fio -filename=/data12/fiotest/testfile -direct=1 -iodepth=4 -th…

OpenAI劃時代大模型——文本生成視頻模型Sora作品欣賞(十五)

Sora介紹 Sora是一個能以文本描述生成視頻的人工智能模型,由美國人工智能研究機構OpenAI開發。 Sora這一名稱源于日文“空”(そら sora),即天空之意,以示其無限的創造潛力。其背后的技術是在OpenAI的文本到圖像生成模…

如何找到企查查天眼查上沒有的企業聯系方式?

相信很多銷售在查找企業聯系方式的過程中,遇到過很多問題。很多人在出入行的時候都使用過企查查,天眼查來查找客戶。 但是在實際工作中使用這上面的聯系方式,效果卻不是很理想,因為上面的信息不是很準確,號碼不是企業…

【嵌入式移植】8、U-Boot源碼分析5—啟動過程分析start.S

U-Boot源碼分析5—啟動過程分析start.S 1、boot0.h2、reset2.1、vectors2.2、ELn2.2.1 EL32.2.2、EL2、EL1 2.3、SMPEN2.3、core errate2.4、lowlevel_init 前面從U-Boot編譯的角度分析了其Makefile、鏈接腳本等,本章開始正式分析U-Boot啟動過程 從上一篇文章7、U-…

ClickHouse SQL Reference (四)數據類型

Tuple(T1, T2, …) 元素元組,每個元素都有一個單獨的類型。元組必須至少包含一個元素。 元組用于臨時列分組。在查詢中使用IN表達式時,以及指定lambda函數的某些形式參數時,可以對列進行分組。有關更多信息,請參閱IN操作符和高階…

u-boot 基礎學習:板級配置 Kconfig 的包含

前言 u-boot 與 Linux 內核在嵌入式Linux開發中占有重要的地位,掌握 u-boot 的基礎開發,可以大大提升開發能力,并提高開發的效率。 u-boot 下 如何配置 板級的Kconfig 呢?u-boot 下板級的 Kconfig 是怎么包含到 主目錄下 Kconfig…

【代碼隨想錄算法訓練營Day34】860.檸檬水找零;406.根據身高重建隊列;452.用最少數量的箭引爆氣球

??Day 34 第八章 貪心算法 part04 ??今日任務 860.檸檬水找零406.根據身高重建隊列452.用最少數量的箭引爆氣球 ??860.檸檬水找零 本題看上好像挺難,其實挺簡單的,大家先嘗試自己做一做。題目鏈接:https://leetcode.cn/problems/lem…

【計算機網絡】IO多路轉接之poll

文章目錄 一、poll函數接口二、socket就緒條件三、poll的優點四、poll的缺點五、poll使用案例--只讀取數據的server服務器1.err.hpp2.log.hpp3.sock.hpp4.pollServer.hpp5.main.cc 一、poll函數接口 #include <poll.h> int poll(struct pollfd *fds, nfds_t nfds, int t…

2024.3.3 訓練記錄(7)

這幾天又忘記每天復習了&#xff0c;以后在實驗室復習完再回去好了 最近做1800的題目好多dp啊太ex了 文章目錄 牛客 練習賽122D 圓CF 1396B Stoned GameCF 1355C Count TrianglesCF 1437C Chef MonocarpCF 271D Good SubstringsCF 1475D Cleaning the PhoneCF 1362D2 Prefix-…

“羊駝“入侵CV,美團浙大沈春華團隊將LLaMA向CV擴展,構建全新基礎模型VisionLLaMA

本文首發:AIWalker https://arxiv.org/abs/2403.00522 https://github.com/Meituan-AutoML/VisionLLaMA 本文概述 大型語言模型構建在基于Transformer的架構之上來處理文本輸入, LLaMA 系列模型在眾多開源實現中脫穎而出。類似LLaMa的Transformer可以用來處理2D圖像嗎&#xf…