目錄
?
urlencode
html實體編碼
Unicode編碼
?
urlencode
URL編碼也稱為百分號編碼,用于將URL中的特殊字符轉換為安全傳輸的格式。英文數字一般不編碼
特點:
-
使用
%
后跟兩個十六進制數字表示字符 -
空格編碼為
+
或%20
-
保留字符(
;
?/
??
?:
?@
?&
?=
?+
?$
?,)
?等在不同URL部分有特殊含義 -
其他字符:轉換為UTF-8字節序列,然后每個字節用
%XX
表示
html實體編碼
HTML實體用于表示HTML中的特殊字符,防止與標簽混淆。
類型:
-
命名實體:
<
表示< -
數字實體:
<
或<
表示<
常見實體:
字符 | 命名實體 | 十進制 | 十六進制 |
---|---|---|---|
< | < | < | < |
> | > | > | > |
& | & | & | & |
" | " | " | " |
空格 | |   |   |
Unicode編碼
Unicode為世界上所有字符提供唯一編號(碼點)
表示方式:
環境 | 格式 | 示例 |
---|---|---|
JavaScript | \uXXXX (4位)或\u{X...} (1-6位) | \u6D4B ?或?\u{6D4B} |
Python | \uXXXX ?或?\UXXXXXXXX | \u6d4b |
HTML | &#xXXXX; ?或?&#NNNNN; | 測 ?或?測 |
Java | \uXXXX | \u6D4B |
C/C++ | \uXXXX ?或?\UXXXXXXXX | \u6D4B |
?
?
?