JSON 解析中需要清理的危險字符

在這里插入圖片描述

在代碼中 replace(chr(0), "") 的作用是刪除 JSON 響應中可能存在的空字符(Null character)。以下是詳細解釋:


1. chr(0) 是什么?

  • chr(0) 表示 ASCII 碼為 0 的字符,即空字符(Null Character),在編程中通常用 \x00 表示。
  • 特點
    • 不可打印(不會在屏幕上顯示任何內容)
    • 常見于二進制數據或某些系統/協議的占位符
    • 在 JSON 標準中不允許出現(RFC 8259 規定 JSON 只能包含可打印的 Unicode 字符)

2. 為什么需要刪除空字符?

當從網絡設備(如華為交換機/防火墻)獲取 RESTCONF 響應時,設備可能在 JSON 數據中意外插入了空字符。例如:

{"huawei-system:systemInfo": {"sysName": "Huawei\u0000Switch"  // 注意這里的 \u0000 是空字符}
}

這會導致 Python 的 json.loads() 解析失敗,拋出 JSONDecodeError


3. 如何驗證空字符的存在?

可以通過以下方式檢查響應內容是否包含空字符:

response_content = response.content.decode('utf8')
print(repr(response_content))  # 使用 repr 可以顯示不可見字符

輸出示例:

'{"huawei-system:systemInfo":{"sysName":"Huawei\u0000Switch"}}'

你會看到 \u0000 表示空字符。


4. 替換空字符的必要性

  • 符合 JSON 規范:確保 JSON 數據格式合法
  • 避免解析錯誤:刪除所有 \x00 字符后,json.loads() 能正常工作
  • 兼容性:某些網絡設備可能因內部實現問題插入冗余空字符

5. 其他字符替換:
\n

代碼中還替換了 
\n(Windows 風格換行符):

  • \r(回車符,ASCII 13)和 \n(換行符,ASCII 10)在 JSON 中不需要轉義
  • 刪除它們可以簡化輸出格式,但不會導致解析錯誤

6. 完整處理流程

# 原始響應內容(含空字符和 Windows 換行)
raw_data = b'{"sysName":"Huawei\u0000Switch\r\n"}'# 解碼為 UTF-8 字符串
decoded_data = raw_data.decode('utf8')  
# -> '{"sysName":"Huawei\u0000Switch\r\n"}'# 刪除空字符和 Windows 換行
cleaned_data = (decoded_data.replace("
\n", " ")   # 替換 Windows 換行為普通空格.replace(chr(0), "")        # 刪除空字符
)# 解析 JSON
json_data = json.loads(cleaned_data)

7. 實際場景中的問題案例

如果不移除空字符,可能會遇到以下錯誤:

json.loads('{"key": "value\u0000"}')  
# 報錯:json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 12 (char 11)

8. 更通用的數據清洗方法

如果需要處理更多特殊字符,可以使用正則表達式:

import recleaned_data = re.sub(r'[^\x20-\x7E]', '', decoded_data)  # 刪除所有非打印 ASCII 字符
  • \x20-\x7E 匹配可打印的 ASCII 字符(空格到 ~

總結

  • chr(0) 是 JSON 解析中需要清理的危險字符
  • 設備可能因硬件/固件問題在響應中插入空字符
  • 通過 replace(chr(0), "") 保證數據合規性
  • 建議在數據清洗階段增加更嚴格的校驗邏輯

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/898474.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/898474.shtml
英文地址,請注明出處:http://en.pswp.cn/news/898474.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

指令系統2(Load/Store 指令)

一. Load/Store 指令 1. 前變址 前變址指令是在讀取或存儲數據時,先根據基址寄存器(Rn)與偏移量(offset)計算出有效地址,再進行數據操作。相關指令及示例如下: LDR R0, [R1, #4]:從…

ubuntu部署運行xinference全精度對話deepseek本地部署圖文教程

前置環境搭建勞請移步往期 source activate 自己環境名啟動python3.12環境安裝xinference, 按教程敲命令,wheel包與wsl的通用,pip install 包名。 vllm引擎,transform引擎也會順帶自動裝上了。 后續操作請參照往期教程。本地部署模…

技術分享 | MySQL內存使用率高問題排查

本文為墨天輪數據庫管理服務團隊第51期技術分享,內容原創,如需轉載請聯系小墨(VX:modb666)并注明來源。 一、問題現象 問題實例mysql進程實際內存使用率過高 二、問題排查 2.1 參數檢查 mysql版本 :8.0.…

[AI速讀]混合語言IP集成:挑戰與高效解決方案

在現代SoC(系統級芯片)設計中,IP(知識產權模塊)復用是提升開發效率的關鍵。然而,當設計涉及多種硬件描述語言(如SystemVerilog、VHDL、SystemC)時,如何高效集成不同語言的IP模塊成為一大難題。本文將從實際設計場景出發,探討混合語言IP集成的核心挑戰,并介紹一套方法…

【vulhub/wordpress靶場】------獲取webshell

1.進入靶場環境: 輸入:cd / vulhub / wordpress / pwnscriptum 修改版本號: vim docker-compose.yml version: 3 保存退出 開啟靶場環境: docker - compose up - d 開啟成功,docker ps查看端口 靶場環境80…

微信小程序:用戶拒絕小程序獲取當前位置后的處理辦法

【1】問題描述: 小程序在調用 wx.getLocation() 獲取用地理位置時,如果用戶選擇拒絕授權,代碼會直接拋出錯誤。如果再次調用 wx.getLocation() 時,就不會在彈窗詢問用戶是否允許授權。導致用戶想要重新允許獲取地理位置時&#x…

NLP 與常見的nlp應用

自然語言處理(NLP)是一個廣泛的領域,它不僅包括自然語言理解(NLU),還涉及一系列其他任務和子領域。以下是NLP領域中的主要組成部分及其相關任務: 1. 自然語言理解(NLU) …

全網首創/純Qt/C++實現國標GB28181服務/實時視頻/云臺控制/預置位/錄像回放和下載/事件訂閱/語音對講

一、前言說明 用純Qt來實現這個GB28181的想法很久了,具體可以追溯到2014年,一晃十年都過去了,總算是整體的框架和邏輯都打通了,總歸還是雜七雜八的事情多,無法靜下心來研究具體的協議,最開始初步了解協議后…

Django+celery+flower

Djangoceleryflower Django的定時任務及可視化監控Django Django的定時任務及可視化監控 Django的定時任務,以及可視化監控。 Django Django; 首先在python中新建虛擬環境并激活 pip install virtualenv python -m venv venv source venv/bin/activa…

Python 編程題 第十一節:選擇排序、插入排序、刪除字符、目標移動、尾部的0

選擇排序 假定第一個為最小的為已排序序列,與后面的比較,找到未排序序列中最小的后,交換位置,獲得最小元素,依次往后 lst[1,14,25,31,21,13,6,8,14,9,7] def selection_sort(lst):for i in range(len(lst)):min_inde…

組態王Kingview配置為OPCUA服務器的一些問題處理

一、問題描述 1、組態王【運行配置】界面沒有【服務配置】的選項,無法將組態王Kingview配置為OPCUA服務器; 2、點擊組態王【運行配置界面】的【服務配置】選項彈窗警告提示【試圖執行的操作不受支持】,如下圖所示: 二、問題分析 …

模塊二 單元4 安裝AD+DC

模塊二 單元4 安裝ADDC 兩個任務: 1.安裝AD活動目錄 2.升級當前服務器為DC域控制器 安裝前的準備工作: 確定你要操作的服務器系統(Windows server 2022); 之前的服務器系統默認是工作組的模式workgroup模式&#xff08…

git clone項目報錯fatal: fetch-pack: invalid index-pack output問題

前情回顧:git項目放在公司服務器上面,克隆等操作需要連接VPN才能操作。由于項目比較大,網速比較慢,克隆項目經常出現fetch-pack: invalid index-pack output。在網上查找各種解決方法。也就這一種有點效果。僅供參考,不…

前端Tailwind CSS面試題及參考答案

解釋 Tailwind CSS 中 w-1/2 和 max-w-md 的區別及適用場景 在 Tailwind CSS 里,w-1/2 和 max-w-md 屬于不同類型的寬度控制類,它們的功能和適用場景存在明顯差異。 w-1/2 是用來設定元素寬度的類。它把元素寬度設定為其父元素寬度的一半。例如&#xff…

《深度剖析:BERT與GPT——自然語言處理架構的璀璨雙星》

在自然語言處理(NLP)的廣袤星空中,BERT(Bidirectional Encoder Representations from Transformers)與GPT(Generative Pretrained Transformer)系列模型宛如兩顆最為耀眼的星辰,引領…

VMware主機換到高配電腦,高版本系統的問題

原來主機是i3 ,windows7系統,vmware 14.0,虛機系統是ubuntu 14.04。目標新機是i7 14700KF,windows11系統。原以為安裝虛擬機,將磁盤文件,虛擬機配置文件拷貝過去可以直接用。 新目標主機先安裝了vmware 15,運行原理虛機&#xff0…

后端框架模塊化

后端框架的模塊化設計旨在簡化開發流程、提高可維護性,并通過分層解耦降低復雜性。以下是常見的后端模塊及其在不同語言(Node.js、Java、Python)中的實現方式: 目錄 1. 路由(Routing)2. 中間件(…

MDG實現BP客商復雜邏輯校驗的方法

引言 項目中可能常用的增強點是USMD_RULE_SERVICE來實現復雜的校驗邏輯,除此之外,SAP對BP主數據還提供了以下的實現方式。 方法1-替換ERP校驗類 眾所周知,BP存在復雜的ERP校驗,主要通過類CL_MDG_BS_FND_BP_CHECK(子…

基于springboot的教務系統(源碼+lw+部署文檔+講解),源碼可白嫖!

摘要 這些年隨著Internet的迅速發展,我們國家和世界都已經進入了互聯網大數據時代,計算機網絡已經成為了整個社會以及經濟發展的巨大動能,各個高校的教務工作成為了學校管理事務的重要目標和任務,因此運用互聯網技術來提高教務的…

TDengine 中的流式計算

簡介 TDengine 中的流計算,功能相當于簡化版的 FLINK , 具有實時計算,計算結果可以輸出到超級表中存儲,同時也可用于窗口預計算,加快查詢速度。 創建流式計算 CREATE STREAM [IF NOT EXISTS] stream_name [stream_o…