Python爬蟲03_Requests破解百度翻譯

爬取百度翻譯頁面信息
以POST方法發送JSON數據,爬取響應信息,并且需要對響應信息對象類型進行區分。

import requests
import json#1.指定url
post_url = 'https://fanyi.baidu.com/sug'#2.進行UA封裝
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:103.0) Gecko/20100101 Firefox/103.0'
}#3.post請求參數處理(同get請求一致)
word = input('enter a word:')
data = {'kw':word
}#4.請求發送
response = requests.post(url=post_url,data=data,headers=headers)#5.獲取響應數據:json()方法返回的是obj(如果確認響應數據是json類型的,才可以使用json()方法
dic_obj = response.json()#6.持久性存儲,可自行設置存儲路徑及文件名
fileName = word+'.json'
fp = open(fileName,'w',encoding='utf-8')
json.dump(dic_obj,fp=fp,ensure_ascii=False)print('over!!!')

響應對象類型
服務器返回的響應數據,本質上是「一串字節流」,但按用途和格式可以分成幾大類:
1. 文本類(人類可讀)

類型MIME 類型(Content-Type例子用途
HTMLtext/html<html>...網頁結構
純文本text/plainHello World簡單文本
JSONapplication/json{"name":"Tom"}API 數據交換
XMLapplication/xml<user><name>Tom</name></user>老派 API、配置文件
CSVtext/csvname,age\nTom,18表格數據
CSS/JStext/css, application/javascript.btn{color:red}樣式和腳本

2. 二進制類(不可直接讀,需解析)

類型MIME 類型例子用途
圖片image/jpeg, image/png, image/webp二進制圖片流展示圖片
音頻/視頻audio/mp3, video/mp4二進制媒體流播放媒體
文件下載application/octet-streamfile.zip任意文件下載
字體文件font/woff2二進制字體網頁字體
Protobufapplication/x-protobuf二進制序列化數據高效接口通信

3. 壓縮或編碼過的數據
Gzip/Deflate/Brotli:響應頭 Content-Encoding: gzip,數據被壓縮,需先解壓。
分塊傳輸:響應頭 Transfer-Encoding: chunked,數據被分塊發送,需拼接。

4. 空數據
狀態碼 204 (No Content):成功但無返回體,比如某些 DELETE 請求。

如何判斷類型?
看響應頭里的兩個關鍵字段:

Content-Type: application/json; charset=utf-8
Content-Encoding: gzip

Content-Type 告訴你「數據格式」。
Content-Encoding 告訴你「是否壓縮」。

響應數據可以是「任何你能用瀏覽器打開的東西」——從網頁、JSON、圖片、視頻,到壓縮包、字體、音頻流,甚至空響應。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/91145.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/91145.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/91145.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【C++進階】第8課—紅黑樹封裝map和set

文章目錄1. map和set的源碼及框架分析2. 模擬實現map和set2.1 實現可以復用紅黑樹的框架&#xff0c;支持insert操作2.2 實現迭代器iterator2.2.1 實現迭代器2.2.2 實現迭代器 - -2.2.3 解決key不能修改的問題2.2.4 重載operator[ ]3. 完整代碼3.1 紅黑樹頭文件RBTree.h3.2 mym…

【機器學習深度學習】DeepSpeed框架:高效分布式訓練的開源利器

目錄 前言 一、DeepSpeed 簡介 1.1 定位與目標 1.2 集成生態 二、核心技術解析 2.1 ZeRO&#xff08;Zero Redundancy Optimizer&#xff09; 2.2 顯存優化技術 2.3 推理優化與通信機制 三、DeepSpeed 的優勢與特性總結 四、 典型應用場景 &#x1f9e0; 大模型訓練…

從視覺到現實:掌握計算機視覺技術學習路線的十大步驟

成長路上不孤單&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;【14后&#x1f60a;///計算機愛好者&#x1f60a;///持續分享所學&#x1f60a;///如有需要歡迎收藏轉發///&#x1f60a;】今日分享關于計算機視覺技術學習路線方面的相關內容…

DeepSeek MoE 技術解析:模型架構、通信優化與負載均衡

1. MoE 簡介 MoE&#xff08;Mixed Expert Models&#xff09;&#xff0c;混合專家模型。在 Transformer 的 FFN 中&#xff0c;有一個重要的觀察是&#xff0c;其計算過程中的神經元激活是非常稀疏的&#xff0c;在一次計算中只有 90%的輸入激活不到 5%的神經元&#xff0c;…

【Linux】pthread學習筆記

1. 線程基礎(1) 線程創建與終止#include <pthread.h> // 創建線程 int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void*), void *arg); // 終止當前線程 void pthread_exit(void *retval); // 等待線程結束 int pthread_joi…

p5.js 從零開始創建 3D 模型,createModel入門指南

點贊 關注 收藏 學會了 如果你已經開始探索 p5.js 的 3D 世界&#xff0c;那么createModel()這個 API 絕對是你需要掌握的強大工具。它允許你創建自定義的 3D 幾何模型&#xff0c;為你的創意提供無限可能。 什么是 createModel ()&#xff1f; createModel() 用于從一個…

react 的 useTransition 、useDeferredValue

useTransition 用于 管理狀態更新的過渡&#xff08;pending&#xff09;狀態&#xff0c;避免因高優先級任務&#xff08;如用戶輸入&#xff09;被低優先級任務&#xff08;如數據獲取或復雜計算&#xff09;阻塞而導致的界面卡頓。 它特別適用于&#xff0c;需要 區分緊急更…

Unity的GameObject.Instantiate的使用

在Unity游戲引擎中&#xff0c;GameObject.Instantiate 是一個核心方法&#xff0c;用于在運行時動態創建游戲對象的副本。它常用于實例化預制體&#xff08;Prefab&#xff09;&#xff0c;例如生成敵人、子彈或場景元素。以下是其使用方法的詳細說明&#xff0c;包括語法、參…

【CSS】盒子類型

CSS盒子模型是網頁布局的核心基礎&#xff0c;每個HTML元素都被視為一個矩形盒子&#xff0c;由??內容&#xff08;Content&#xff09;、內邊距&#xff08;Padding&#xff09;、邊框&#xff08;Border&#xff09;、外邊距&#xff08;Margin&#xff09;??四部分組成。…

《嵌入式C語言筆記(十五):字符串操作與多維指針深度解析》

1.字符串與指針安全操作核心函數與陷阱函數功能安全替代功能strcpy字符串拷貝strncpy復制前n個&#xff0c;最多strlen個&#xff0c;超出有效長度&#xff0c;按原樣復制strcat字符串拼接strncatdest只連接src的前n個&#xff0c;如果n超過有效長度&#xff0c;按原樣鏈接strc…

每日學習筆記記錄(分享更新版-凌亂)

函數和變量都需要滿足&#xff1a;先聲明后使用&#xff08;重要&#xff09;在 函數的聲明中&#xff0c;形參的名字可以省略函數的定義是一種特殊的是聲明&#xff0c;比聲明更加強大&#xff1b;函數使用前必須進行聲明&#xff0c;但不必要聲明具體定義.h——函數的聲明.c—…

Windows提權(MS09-012 巴西烤肉)

演示環境&#xff1a;windows-2003前提&#xff1a;提權的前提條件是拿到服務器的webshell演示以iis的中間件解析漏洞為例&#xff08;test.asp;.jpg&#xff09; Windows提權拿到webshell之后&#xff0c;使用菜刀&#xff0c;蟻劍&#xff0c;冰蝎或者哥斯拉連接上服務器&…

常見依賴于TCP/IP的應用層協議

Protocol 協議 Acronym 縮寫 Port 端口 Description 描述 Telnet Telnet 23 Remote login service 遠程登錄服務 Secure Shell SSH 22 Secure remote login service 安全遠程登錄服務 Simple Network Management Protocol 簡單網絡管理協議 SNMP 161-162 Manage network d…

XML Schema 指示器:全面解析與深度應用

XML Schema 指示器:全面解析與深度應用 引言 XML Schema 是一種用于定義 XML 文檔結構的語言,它為 XML 文檔提供了嚴格的框架,以確保數據的準確性和一致性。在本文中,我們將深入探討 XML Schema 的基本概念、關鍵特性、指示器的作用以及其實際應用。 XML Schema 的基本概…

13、select_points_object_model_3d解析

名字 select_points_object_model_3d- 將閾值應用于 3D 對象模型的屬性。 簽名 select_points_object_model_3d( : : ObjectModel3D, Attrib,

ThinkPHP6.1+Ratchet庫 搭建websocket服務

Ratchet 是一個基于 ReactPHP 的 PHP WebSocket 庫&#xff0c;無需依賴 Swoole 擴展。以下是實現步驟&#xff1a;首先安裝 Ratchet&#xff1a;composer require cboden/ratchet創建 WebSocket 處理類&#xff1a;<?php /*** websocket處理類* DateTime 2025/7/28 10:38…

智慧工地系統:科技如何重塑建筑現場?

前幾天路過一個正在施工的樓盤&#xff0c;看到現場雖然機器轟鳴&#xff0c;但秩序井然&#xff0c;工人們佩戴著設備&#xff0c;指揮塔上閃爍著指示燈&#xff0c;和印象中那種塵土飛揚、雜亂無章的工地景象完全不同。當時就感慨&#xff0c;現在工地也“智慧”起來了。后來…

Day 25:異常處理

Day 25: Python異常處理機制 Review 上一節主要是熟悉os等python中的文件操作&#xff0c;包含&#xff1a; 基礎操作&#xff1a;目錄獲取、文件列舉、路徑拼接系統交互&#xff1a;環境變量管理、跨平臺兼容性高級功能&#xff1a;目錄樹遍歷、文件系統分析 Today 今天專…

Apache Ignite 的分布式隊列(IgniteQueue)和分布式集合(IgniteSet)的介紹

以下的內容是關于 Apache Ignite 的分布式隊列&#xff08;IgniteQueue&#xff09;和分布式集合&#xff08;IgniteSet&#xff09; 的介紹。它們是 Ignite 提供的分布式數據結構&#xff0c;讓你可以在整個集群中像使用本地 BlockingQueue 或 Set 一樣操作共享的數據。 下面我…

HTML5 `<figure>` 標簽:提升網頁語義化與可訪問性的利器

目錄什么是 <figure> 標簽&#xff1f;為什么我們要用 <figure>&#xff1f;<figure> 標簽的語法<figure> 標簽的適用場景1 圖片及其說明 (最常用)2 代碼片段及其注釋3 圖表、流程圖或數據可視化4 引用或引文 (Quote) 及其出處總結在現代網頁開發中&am…