python爬蟲筆記(一)

文章目錄

    • html
      • 基礎
        • 標簽和下劃線
        • 無序列表和有序列表
        • 表格
          • 加邊框
      • html的屬性
        • a標簽(網站)
          • target屬性
          • 換行線和水平分割線
        • 圖片
          • 設置寬高width,height
      • html區塊——塊元素與行內元素
        • 塊元素與行內元素
        • 塊元素舉例
          • 行內元素舉例
      • 表單
        • from標簽
          • type屬性
          • placeholder屬性
          • value屬性
          • span標簽的應用
          • radio選項
        • label標簽
          • for屬性
          • checkbox多選
          • submit屬性
        • from標簽
        • css
        • css三種導入方式
        • 選擇器
        • 元素選擇器、類選擇器、ID選擇器、通用選擇器
        • 子元素選擇器(嵌套),后代選擇器
        • 后代選擇器示例
        • 偽類選擇器
      • css屬性

在這里插入圖片描述

在這里插入圖片描述

import requests
response = requests.get( "http://books.toscrape.com/")
if response.ok:print(response.text)
else:print("請求失敗")

有User-Agent

import requests
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62"
}
response = requests.get("https://movie.douban.com/top250",headers=headers)
print(response.status_code)
from bs4 import BeautifulSoup
import requests
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/116.0.0.0"
}
response = requests.get("http://books.toscrape.com/", headers=headers)
content = response.text
soup = BeautifulSoup(content,"html.parser")
all_prices = soup.find_all("p",attrs={"class": "price_color"})
# for price in all_prices:
#     print(price)
for price in all_prices:# print(price.text)# print(price)# print(price.string)print(price.string[2:])
from bs4 import BeautifulSoup
import requests
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/116.0.0.0"
}
for start_num in range(0,250,25):response = requests.get(f"https://movie.douban.com/top250?start={start_num}", headers=headers)html = response.textsoup = BeautifulSoup(html,"html.parser")all_titles = soup.findAll( "span",attrs={"class":"title"})for title in all_titles:title_string=title.stringif "/" not in title_string:print(title_string)

在這里插入圖片描述

html

基礎

標簽和下劃線

在這里插入圖片描述
在這里插入圖片描述

無序列表和有序列表

在這里插入圖片描述
在這里插入圖片描述

表格

在這里插入圖片描述
在這里插入圖片描述

加邊框

在這里插入圖片描述

html的屬性

在這里插入圖片描述

a標簽(網站)

在這里插入圖片描述
在這里插入圖片描述

target屬性

在這里插入圖片描述

在這里插入圖片描述
1.self鏈接在當前窗口打開
2.blank鏈接在新窗口打開
3.parent鏈接在父窗口打開
4.top鏈接在頂層窗口打開

換行線和水平分割線

在這里插入圖片描述
在這里插入圖片描述
換行是br,水平分割線是hr

圖片

在這里插入圖片描述

設置寬高width,height

html區塊——塊元素與行內元素

塊元素與行內元素

在這里插入圖片描述

在這里插入圖片描述

塊元素舉例

用于結構或布局
-------------------------------------------------------------a
在這里插入圖片描述
在這里插入圖片描述

------------------------------------------------------------------------a

行內元素舉例

用于內聯樣式化文本,給文本的一部分用樣式或標記
在這里插入圖片描述

在這里插入圖片描述

表單

from標簽
type屬性

input標簽,type屬性規定了input的類型

在這里插入圖片描述

w3cschool.cn/html5/html5-input.html

可以在網站輸入內容
在這里插入圖片描述
在這里插入圖片描述

placeholder屬性

在這里插入圖片描述
在這里插入圖片描述

value屬性

自動填寫“請輸入內容”
在這里插入圖片描述
在這里插入圖片描述

span標簽的應用

在這里插入圖片描述
在這里插入圖片描述

radio選項

在這里插入圖片描述
在這里插入圖片描述
加入gender只能選一個,不加可以全部勾選
在這里插入圖片描述

在這里插入圖片描述

label標簽
for屬性

for一般與id綁定

password屬性
在這里插入圖片描述
在這里插入圖片描述

checkbox多選

在這里插入圖片描述
在這里插入圖片描述

submit屬性

在這里插入圖片描述
在這里插入圖片描述

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=html, initial-scale=1.0"><title>html練習</title>
</head>
<body><form><label>用戶名:</label><input type="text" placeholder="請輸入用戶名"><br><br><label for="pwd">密碼:</label><input type="password" id="pwd" placeholder="請輸入密碼"><br><br><label>性別:</label><input type="radio" name="gender"><input type="radio" name="gender"><input type="radio" name="gender">其他<br><br><label>愛好:</label><input type="checkbox" name="hobby">唱歌<input type="checkbox" name="hobby">跳舞<input type="checkbox" name="hobby">RAP<input type="checkbox" name="hobby">籃球<br><br><input type="submit"></form><form action="#"></form>
</body>
</html>

#需要為服務器,即api

from標簽

提交后具體數據存到哪里
就是from中action屬性

css

在這里插入圖片描述

<!DOCTYPE html>
<html>
<head><style>p {color: blue; /* 將所有 price_color 類的文本改為藍色 */font-size: 16px;}</style>
</head>
<body><p>這是一個應用css樣式的文本</p>  
</body>
</html>
css三種導入方式

在這里插入圖片描述

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=html, initial-scale=1.0"><title>html練習</title><!-- <link rel="stylesheet" href="./style.css"  --><style>p {color: blue; /* 將所有 p 標簽的文本改為藍色 */font-size: 16px;}h2 {color: green;}</style>
</head>
<body><p>這是一個應用css樣式的文本</p>  <h1 style="color: red;">這是一個一級標題使用內聯樣式</h1><h2>這是一個二級標題,應用外部樣式</h2><h3>這是一個三級標題,應用外部樣式</h3>
</body>
</html>
選擇器

在這里插入圖片描述
在這里插入圖片描述

元素選擇器、類選擇器、ID選擇器、通用選擇器
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>h2{color:aqua;}  /* 元素選擇器 */.highlight{background-color: yellow;}#header{font-size: 55px;}        /* id選擇器 */*{font-family:'Franklin Gothic Medium', 'Arial Narrow', Arial, sans-serif;}/* 通用選擇器 */</style> 
</head> 
<body><h1>不同類型的css選擇器</h1><h2>這是一個元素選擇器示例</h2><h3 class="highlight">這是一個類選擇器示例</h3> <h3>這是另一個類選擇器示例</h3><h4 id="header">這是一個id選擇器示例 </h4></body>
</html>

在這里插入圖片描述

子元素選擇器(嵌套),后代選擇器
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>.father>.son{color:yellowgreen;}/* 子元素選擇器 */</style> 
</head> 
<body>

在這里插入圖片描述

后代選擇器示例
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>#header{font-size: 55px;}        /* id選擇器 */.father>.son{color:yellowgreen;}/* 子元素選擇器 */</style> 
</head> 
<body><div class="father"><p class="son">這是一個子元素選擇器示例</p>
</div>
<div><p class="grandson">這是一個后代選擇器示例</p>
</div>
</body>
</html>

在這里插入圖片描述

后代包含子代,子代不包含孫子代,之所以后代選擇器每變色是英文grandson不是子代

偽類選擇器
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>#header{font-size: 55px;}        /* id選擇器 */#element:hover{background-color: purple;}</style> 
</head> 
<body><h3 id="element">這是一個偽類選擇器示例</h3></body>
</html>

在這里插入圖片描述
鼠標懸浮背景顏色會變

css屬性

background-color
font-size
font-family
font-weight
在這里插入圖片描述
菜鳥教程網站

runoob.com/cssref/css-reference.html#font

在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73510.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73510.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73510.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【mysql】centOS7安裝mysql詳細操作步驟!—通過tar包方式

【mysql】centOS7安裝mysql詳細操作步驟&#xff01; linux系統安裝mysql版本 需要 root 權限&#xff0c;使用 root 用戶進行命令操作。使用tar文件包&#xff0c;安裝&#xff0c;gz包也可以但是還需要配置用戶&#xff0c;tar包雖然大&#xff0c;但是全啊&#xff01; 1. …

[新能源]新能源汽車快充與慢充說明

接口示意圖 慢充接口為交流充電口&#xff08;七孔&#xff09;&#xff0c;快充接口為直流充電口&#xff08;九孔&#xff09;。 引腳說明 上圖給的是充電口的引腳圖&#xff0c;充電槍的為鏡像的。 慢充接口引腳說明 快充接口引腳說明 充電流程 慢充示意圖 慢充&…

Android第二次面試總結(項目拷打理論篇)

&#xff08;一&#xff09;理論基礎 LiveData 和 ViewModel 是 Android 架構組件中的重要部分&#xff0c;它們在構建響應式、生命周期感知的 Android 應用程序中發揮著關鍵作用。下面分別介紹它們的原理。 LiveData 原理 1. 概述 LiveData 是一種可觀察的數據持有者類&…

MyBatis SqlSessionFactory 是如何創建的?

SqlSessionFactory 是 MyBatis 的核心接口之一&#xff0c;它是創建 SqlSession 實例的工廠。 SqlSession 實例是 MyBatis 與數據庫交互的主要接口&#xff0c;負責執行 SQL 語句、管理事務等。 SqlSessionFactory 的創建過程主要由 SqlSessionFactoryBuilder 類負責。 SqlSes…

玩轉python:通俗易懂掌握高級數據結構-collections模塊之Counter

引言 Counter是Python中collections模塊提供的一個強大工具&#xff0c;用于統計可哈希對象的出現次數。它非常適合用于頻率統計、詞頻分析、數據聚合等場景。本文將詳細介紹Counter的關鍵用法和特性&#xff0c;并通過8個豐富的案例幫助讀者掌握其應用。 關鍵用法和特性表格 …

DeepSeek面試——分詞算法

DeepSeek-V3 分詞算法 一、核心算法&#xff1a;字節級BPE&#xff08;Byte-level BPE&#xff0c;BBPE&#xff09; DeepSeek-V3 采用 字節級BPE&#xff08;BBPE&#xff09; 作為核心分詞算法&#xff0c;這是對傳統 BPE&#xff08;Byte Pair Encoding&#xff09;算法的…

機器學習——正則化、欠擬合、過擬合、學習曲線

過擬合&#xff08;overfitting&#xff09;:模型只能擬合訓練數據的狀態。即過度訓練。 避免過擬合的幾種方法&#xff1a; ①增加全部訓練數據的數量&#xff08;最為有效的方式&#xff09; ②使用簡單的模型&#xff08;簡單的模型學不夠&#xff0c;復雜的模型學的太多&am…

Python:函數(一)

python函數相關的知識點 1. 函數定義與調用 定義&#xff1a;使用 def 關鍵字&#xff0c;后接函數名和參數列表。 def greet(name):"""打印問候語&#xff08;文檔字符串&#xff09;"""print(f"Hello, {name}!") 調用&#xff1a…

關于Flutter中兩種Widget的生命周期詳解

目錄 一、StatelessWidget 生命周期 二、StatefulWidget 生命周期 1. 創建階段 2. State初始化階段 3. 構建階段 4. 更新階段 5. 銷毀階段 三、核心對比與常見陷阱 四、面試回答技巧 以下是Flutter中兩種核心Widget(StatelessWidget和StatefulWidget)生命周…

Linux 》》Ubuntu 18 LTS 之后的版本 修改IP地址 主機名

進入目錄 /etc/netplan 修改 50-cloud-init.yaml 》保存文件后&#xff0c;執行以下命令應用更改&#xff1a; sudo netplan apply 》》 DHCP模式 修改主機名 hostnamectl set-hostname xxxx 修改cloud.cfg 防止重啟主機名還原 但測試下來 不修改&#xff0c; 重啟 也不會還…

C++基礎 [三] - 面向對象三

初始化列表 首先&#xff0c;初始化列表是我們的祖師爺本賈尼博士為了解決在某些成員變量在定義時必須初始化的情況。這個初始化列表其實發生在構造函數之前&#xff0c;也就是實例化整個對象時先對所有的成員都進行了初始化 初始化的概念區分 在之前的博客學習中&#xff…

55年免費用!RevoUninstaller Pro專業版限時領取

今天&#xff0c;我要給大家介紹一款超給力的卸載工具——RevoUninstaller Pro。這是一款由保加利亞團隊精心打造的專業級卸載軟件&#xff0c;堪稱軟件卸載界的“神器”。 RevoUninstaller分為免費版和專業版。專業版功能更為強大&#xff0c;但通常需要付費才能解鎖全部功能。…

目前人工智能的發展,判斷10年、20年后的人工智能發展的主要方向,或者帶動的主要產業

根據2025年的最新行業研究和技術演進趨勢&#xff0c;結合歷史發展軌跡&#xff0c;未來10-20年人工智能發展的主要方向及帶動的產業將呈現以下六大核心趨勢&#xff1a; 一、算力革命與底層架構優化 核心地位&#xff1a;算力將成為類似“新能源電池”的基礎設施&#xff0c;…

【機器人】復現 ASGrasp 通用透明物體重建、6-DoF抓取預測

在機器人抓取領域&#xff0c;透明和鏡面物體的抓取一直是個難題。 ASGrasp核心是兩層學習型立體網絡&#xff0c;能夠同時恢復透明和鏡面物體的可見部分和不可見部分的深度信息。 然后融合兩層深度信息&#xff0c;進行重建物體&#xff0c;得到點云信息作為GSNet&#xff0…

2. qt寫帶有槽的登錄界面(c++)

我們在1.Qt寫簡單的登錄界面(c)_c qt 設計一個簡單界面-CSDN博客中寫了個簡單的登錄界面&#xff0c;但沒有槽&#xff0c;在這里寫一個帶有槽的界面。 1.代碼 代碼目錄如下&#xff1a; main.cpp的代碼如下&#xff1a; #include "MainWindow.h" #include <Qt…

windows安裝兩個或多個JDK,并實現自由切換

我用兩個JDK來做演示&#xff0c;分別是JDK8和JDK17(本人已安裝JDK8&#xff0c;所以這里只演示JDK17的安裝)。 1、下載JDK17安裝 Java Downloads | Oracle 2、安裝JDK17,這里忽略。直接雙擊軟件&#xff0c;點擊下一步就可以。 3、配置環境變量 在系統變量中新建一個CLASSP…

【2025最新】深度學習框架PyTorch——從入門到精通(1)下載與安裝

又名&#xff1a;蕪湖起飛俠的PyTorch學習記錄——從起飛到墜毀 簡介安裝內容總覽安裝AnacondaAnaconda簡介Anaconda下載配置環境變量驗證其他配置安裝matplotlib 安裝 CUDA安裝之前安裝cuDNN 安裝torchCPU 版本安裝GPU 版本安裝通過pip安裝&#xff08;不推薦&#xff09;通過…

C++數據結構1——棧結構詳解

一、棧的基本概念與特性 1. 棧的定義與特點 棧&#xff08;Stack&#xff09;是一種遵循后進先出&#xff08;LIFO, Last In First Out&#xff09;原則的線性數據結構&#xff0c;其核心特征包括&#xff1a; 單端操作&#xff1a;所有操作僅通過棧頂進行 動態存儲&#xf…

【Python 數據結構 15.哈希表】

目錄 一、哈希表的基本概念 1.哈希表的概念 2.鍵值對的概念 3.哈希函數的概念 4.哈希沖突的概念 5.常用的哈希函數 Ⅰ、直接定址法 Ⅱ、平方取中法 Ⅲ、折疊法 Ⅳ、除留余數法 Ⅴ、位與法 6.哈希沖突的解決方案 Ⅰ、開放定址法 Ⅱ、鏈地址法 7.哈希表的初始化 8.哈希表的元素插…

歷年云南大學計算機復試上機真題

歷年云南大學計算機復試機試真題 在線評測&#xff1a;傳送門&#xff1a;pgcode.cn 喝飲料 題目描述 商店里有 n 中飲料&#xff0c;第 i 種飲料有 mi 毫升&#xff0c;價格為 wi。 小明現在手里有 x 元&#xff0c;他想吃盡量多的飲料&#xff0c;于是向你尋求幫助&#x…