🍺ASCII相關文章匯總如下🍺:
- 🎈ASCII碼對照表(255個ascii字符匯總)🎈
- 🎈ASCII碼對照表(Unicode 字符集列表)🎈
- 🎈ASCII碼對照表(emoji表情符號)🎈
- 🎈ASCII碼對照表(Python代碼實現打印)🎈
- 🎈ASCII碼對照表(C++17 實現ANSI、UTF8、Unicode編碼互轉)🎈
- 🎈ASCII碼對照表(HTML顏色代碼表)🎈
- 🎈ASCII碼對照表(Matplotlib顏色對照表)🎈
- 🎈ASCII碼對照表【2024年匯總】🎈
文章目錄
- 1、簡介
- 2、表格形式
- 3、圖片形式
- 4、常用轉義字符
- 5、ASCII、Unicode 和 UTF-8 之間的關系
- 5.1 ASCII 編碼
- 5.2 非 ASCII 編碼
- 5.3 Unicode
- 5.4 UTF-8
- 5.5 Little endian 和 Big endian
- 結語
1、簡介
ASCII(發音:,American Standard Code for Information Interchange,美國信息交換標準代碼)是基于拉丁字母的一套電腦編碼系統。它主要用于顯示現代英語,而其擴展版本延伸美國標準信息交換碼則可以部分支持其他西歐語言,并等同于國際標準ISO/IEC 646。
ASCII 由電報碼發展而來。第一版標準發布于1963年 ,1967年經歷了一次主要修訂[5][6],最后一次更新則是在1986年,至今為止共定義了128個字符;其中33個字符無法顯示(一些終端提供了擴展,使得這些字符可顯示為諸如笑臉、撲克牌花式等8-bit符號),且這33個字符多數都已是陳廢的控制字符。控制字符的用途主要是用來操控已經處理過的文字。在33個字符之外的是95個可顯示的字符。用鍵盤敲下空白鍵所產生的空白字符也算1個可顯示字符(顯示為空白)。
- 1、ASCII碼 是現今最通用的單字節編碼系統,并等同于國際標準ISO/IEC 646 。在這個頁面,你可以找到8位的256個字符、ASCII碼表和Windows-1252 (code page 1252,它是國際標準ISO 8859-1的一個擴展字符集) 標準保持一致;
- 2、ASCII碼 是 American Standard Code for Information Interchange 的縮寫,而不是ASCⅡ(羅馬數字2),有很多人在這個地方產生誤解;
- 3、ASCII碼 規范于1967年第一次發布,最后一次更新是在1986年,它包含了33個控制字符(具有某些特殊功能但是無法顯示的字符)和95個可顯示字符;
ASCII ,它的全稱是"美國信息交換標準代碼"。它設計于60年代早期,是計算機和諸如打印機、磁帶驅動器之類的硬件設備的標準字符集。
ASCII 是 7 比特字符集,包含了 128 個不同的字符值。
ASCII 支持 0-9 的數字,A-Z大寫和小寫英文字母,以及一些特殊字符。
被廣泛使用于現代計算機、HTML和因特網上的字符集都是基于 ASCII 。
ASCII英文全稱:American Standard Code for Information Interchange,即:美國信息交換標準代碼,是基于拉丁字母的一套電腦編碼系統,主要用于顯示現代英語和其他西歐語言。它是最通用的信息交換標準,并等同于國際標準ISO/IEC 646。ASCII第一次以規范標準的類型發表是在1967年,1986年定義了常用的128個字符。
ASCII碼對照表中文發音為阿斯克碼表,標準ASCII碼表通常作為各種符號的16進制對照表使用,但通常講的ASCII碼其實是指ASCII碼的十進制值。比如:字母a的ascii碼值為97,空格的ascii碼值為32。
這里匯集了最完整的ASCII碼對照表,包含32個字符的ASCII控制字符對照表(即非打印字符對照表)、96個字符的ASCII打印字符對照表、128個字符的ASCII擴展字符對照表。覆蓋了常用的128個字符和128個擴展字符。常用的128個字符,對應ASCII十六進制編碼范圍為0x00-0x7F,即十進制的0-127,包含32個非打印控制字符和96個打印字符,打印字符包括可顯示字符(數字、字母、符號)和空格及刪除命令。
2、表格形式
0~31 之間的ASCII碼常用于控制像打印機一樣的外圍設備。
十進制 DEC | 八進制 OCT | 十六進制 HEX | 二進制 BIN | 符號 Symbol | HTML 實體編碼 | 中文解釋 Description | 英文解釋 Description | |
---|---|---|---|---|---|---|---|---|
0 | 000 | 00 | 00000000 | NUL | � | 空字符 終止符 | Null char | |
1 | 001 | 01 | 00000001 | SOH |  | 標題開始 | Start of Heading | |
2 | 002 | 02 | 00000010 | STX |  | 正文開始 | Start of Text | |
3 | 003 | 03 | 00000011 | ETX |  | 正文結束 | End of Text | |
4 | 004 | 04 | 00000100 | EOT |  | 傳輸結束 | End of Transmission | |
5 | 005 | 05 | 00000101 | ENQ |  | 詢問 | Enquiry | |
6 | 006 | 06 | 00000110 | ACK |  | 收到通知 | Acknowledgment | |
7 | 007 | 07 | 00000111 | BEL |  | 鈴 | Bell | |
8 | 010 | 08 | 00001000 | BS |  | 退格 | Back Space | |
9 | 011 | 09 | 00001001 | HT | 	 | 水平制表符 | Horizontal Tab | |
10 | 012 | 0A | 00001010 | LF | 
 | 換行符 \n | Line Feed | |
11 | 013 | 0B | 00001011 | VT |  | 垂直制表符 | Vertical Tab | |
12 | 014 | 0C | 00001100 | FF |  | 換頁符 | Form Feed | |
13 | 015 | 0D | 00001101 | CR | 
 | 回車符 \r | Carriage Return | |
14 | 016 | 0E | 00001110 | SO |  | 移出 | Shift Out / X-On | |
15 | 017 | 0F | 00001111 | SI |  | 移入 | Shift In / X-Off | |
16 | 020 | 10 | 00010000 | DLE |  | 數據鏈路轉義 | Data Line Escape | |
17 | 021 | 11 | 00010001 | DC1 |  | 設備控制 1 | Device Control 1 (oft. XON) | |
18 | 022 | 12 | 00010010 | DC2 |  | 設備控制 2 | Device Control 2 | |
19 | 023 | 13 | 00010011 | DC3 |  | 設備控制 3 | Device Control 3 (oft. XOFF) | |
20 | 024 | 14 | 00010100 | DC4 |  | 設備控制 4 | Device Control 4 | |
21 | 025 | 15 | 00010101 | NAK |  | 拒絕接收 | Negative Acknowledgement | |
22 | 026 | 16 | 00010110 | SYN |  | 同步空閑 | Synchronous Idle | |
23 | 027 | 17 | 00010111 | ETB |  | 傳輸塊結束 | End of Transmit Block | |
24 | 030 | 18 | 00011000 | CAN |  | 取消 | Cancel | |
25 | 031 | 19 | 00011001 | EM |  | 介質中斷 | End of Medium | |
26 | 032 | 1A | 00011010 | SUB |  | 替換 | Substitute | |
27 | 033 | 1B | 00011011 | ESC |  | 換碼符 | Escape | |
28 | 034 | 1C | 00011100 | FS |  | 文件分隔符 | File Separator | |
29 | 035 | 1D | 00011101 | GS |  | 組分隔符 | Group Separator | |
30 | 036 | 1E | 00011110 | RS |  | 記錄分離符 | Record Separator | |
31 | 037 | 1F | 00011111 | US |  | 單元分隔符 | Unit Separator |
十進制 DEC | 八進制 OCT | 十六進制 HEX | 二進制 BIN | 符號 Symbol | HTML 實體編碼 | 中文解釋 Description | 英文解釋 Description | |
---|---|---|---|---|---|---|---|---|
32 | 040 | 20 | 00100000 | ? |   | 空格 | Space | |
33 | 041 | 21 | 00100001 | ! | ! | 感嘆號 | Exclamation mark | |
34 | 042 | 22 | 00100010 | " | " | 雙引號 | Double quotes (or speech marks) | |
35 | 043 | 23 | 00100011 | # | # | 井號 | Number | |
36 | 044 | 24 | 00100100 | $ | $ | 美元符 | Dollar | |
37 | 045 | 25 | 00100101 | % | % | 百分號 | Per cent sign | |
38 | 046 | 26 | 00100110 | & | & | 與 | Ampersand | |
39 | 047 | 27 | 00100111 | ' | ' | 單引號 | Single quote | |
40 | 050 | 28 | 00101000 | ( | ( | 左括號 | Open parenthesis (or open bracket) | |
41 | 051 | 29 | 00101001 | ) | ) | 右括號 | Close parenthesis (or close bracket) | |
42 | 052 | 2A | 00101010 | * | * | 星號 | Asterisk | |
43 | 053 | 2B | 00101011 | + | + | 加號 | Plus | |
44 | 054 | 2C | 00101100 | , | , | 逗號 | Comma | |
45 | 055 | 2D | 00101101 | - | - | 連字號或減號 | Hyphen | |
46 | 056 | 2E | 00101110 | . | . | 句點或小數點 | Period, dot or full stop | |
47 | 057 | 2F | 00101111 | / | / | 斜杠 | Slash or divide | |
48 | 060 | 30 | 00110000 | 0 | 0 | 0 | Zero | |
49 | 061 | 31 | 00110001 | 1 | 1 | 1 | One | |
50 | 062 | 32 | 00110010 | 2 | 2 | 2 | Two | |
51 | 063 | 33 | 00110011 | 3 | 3 | 3 | Three | |
52 | 064 | 34 | 00110100 | 4 | 4 | 4 | Four | |
53 | 065 | 35 | 00110101 | 5 | 5 | 5 | Five | |
54 | 066 | 36 | 00110110 | 6 | 6 | 6 | Six | |
55 | 067 | 37 | 00110111 | 7 | 7 | 7 | Seven | |
56 | 070 | 38 | 00111000 | 8 | 8 | 8 | Eight | |
57 | 071 | 39 | 00111001 | 9 | 9 | 9 | Nine | |
58 | 072 | 3A | 00111010 | : | : | 冒號 | Colon | |
59 | 073 | 3B | 00111011 | ; | ; | 分號 | Semicolon | |
60 | 074 | 3C | 00111100 | < | < | 小于 | Less than (or open angled bracket) | |
61 | 075 | 3D | 00111101 | = | = | 等號 | Equals | |
62 | 076 | 3E | 00111110 | > | > | 大于 | Greater than (or close angled bracket) | |
63 | 077 | 3F | 00111111 | ? | ? | 問號 | Question mark | |
64 | 100 | 40 | 01000000 | @ | @ | 電子郵件符號 | At symbol | |
65 | 101 | 41 | 01000001 | A | A | 大寫字母 A | Uppercase A | |
66 | 102 | 42 | 01000010 | B | B | 大寫字母 B | Uppercase B | |
67 | 103 | 43 | 01000011 | C | C | 大寫字母 C | Uppercase C | |
68 | 104 | 44 | 01000100 | D | D | 大寫字母 D | Uppercase D | |
69 | 105 | 45 | 01000101 | E | E | 大寫字母 E | Uppercase E | |
70 | 106 | 46 | 01000110 | F | F | 大寫字母 F | Uppercase F | |
71 | 107 | 47 | 01000111 | G | G | 大寫字母 G | Uppercase G | |
72 | 110 | 48 | 01001000 | H | H | 大寫字母 H | Uppercase H | |
73 | 111 | 49 | 01001001 | I | I | 大寫字母 I | Uppercase I | |
74 | 112 | 4A | 01001010 | J | J | 大寫字母 J | Uppercase J | |
75 | 113 | 4B | 01001011 | K | K | 大寫字母 K | Uppercase K | |
76 | 114 | 4C | 01001100 | L | L | 大寫字母 L | Uppercase L | |
77 | 115 | 4D | 01001101 | M | M | 大寫字母 M | Uppercase M | |
78 | 116 | 4E | 01001110 | N | N | 大寫字母 N | Uppercase N | |
79 | 117 | 4F | 01001111 | O | O | 大寫字母 O | Uppercase O | |
80 | 120 | 50 | 01010000 | P | P | 大寫字母 P | Uppercase P | |
81 | 121 | 51 | 01010001 | Q | Q | 大寫字母 Q | Uppercase Q | |
82 | 122 | 52 | 01010010 | R | R | 大寫字母 R | Uppercase R | |
83 | 123 | 53 | 01010011 | S | S | 大寫字母 S | Uppercase S | |
84 | 124 | 54 | 01010100 | T | T | 大寫字母 T | Uppercase T | |
85 | 125 | 55 | 01010101 | U | U | 大寫字母 U | Uppercase U | |
86 | 126 | 56 | 01010110 | V | V | 大寫字母 V | Uppercase V | |
87 | 127 | 57 | 01010111 | W | W | 大寫字母 W | Uppercase W | |
88 | 130 | 58 | 01011000 | X | X | 大寫字母 X | Uppercase X | |
89 | 131 | 59 | 01011001 | Y | Y | 大寫字母 Y | Uppercase Y | |
90 | 132 | 5A | 01011010 | Z | Z | 大寫字母 Z | Uppercase Z | |
91 | 133 | 5B | 01011011 | [ | [ | 左中括號 | Opening bracket | |
92 | 134 | 5C | 01011100 | \ | \ | 反斜杠 | Backslash | |
93 | 135 | 5D | 01011101 | ] | ] | 右中括號 | Closing bracket | |
94 | 136 | 5E | 01011110 | ^ | ^ | 音調符號 | Caret - circumflex | |
95 | 137 | 5F | 01011111 | _ | _ | 下劃線 | Underscore | |
96 | 140 | 60 | 01100000 | ` | ` | 重音符 | Grave accent | |
97 | 141 | 61 | 01100001 | a | a | 小寫字母 a | Lowercase a | |
98 | 142 | 62 | 01100010 | b | b | 小寫字母 b | Lowercase b | |
99 | 143 | 63 | 01100011 | c | c | 小寫字母 c | Lowercase c | |
100 | 144 | 64 | 01100100 | d | d | 小寫字母 d | Lowercase d | |
101 | 145 | 65 | 01100101 | e | e | 小寫字母 e | Lowercase e | |
102 | 146 | 66 | 01100110 | f | f | 小寫字母 f | Lowercase f | |
103 | 147 | 67 | 01100111 | g | g | 小寫字母 g | Lowercase g | |
104 | 150 | 68 | 01101000 | h | h | 小寫字母 h | Lowercase h | |
105 | 151 | 69 | 01101001 | i | i | 小寫字母 i | Lowercase i | |
106 | 152 | 6A | 01101010 | j | j | 小寫字母 j | Lowercase j | |
107 | 153 | 6B | 01101011 | k | k | 小寫字母 k | Lowercase k | |
108 | 154 | 6C | 01101100 | l | l | 小寫字母 l | Lowercase l | |
109 | 155 | 6D | 01101101 | m | m | 小寫字母 m | Lowercase m | |
110 | 156 | 6E | 01101110 | n | n | 小寫字母 n | Lowercase n | |
111 | 157 | 6F | 01101111 | o | o | 小寫字母 o | Lowercase o | |
112 | 160 | 70 | 01110000 | p | p | 小寫字母 p | Lowercase p | |
113 | 161 | 71 | 01110001 | q | q | 小寫字母 q | Lowercase q | |
114 | 162 | 72 | 01110010 | r | r | 小寫字母 r | Lowercase r | |
115 | 163 | 73 | 01110011 | s | s | 小寫字母 s | Lowercase s | |
116 | 164 | 74 | 01110100 | t | t | 小寫字母 t | Lowercase t | |
117 | 165 | 75 | 01110101 | u | u | 小寫字母 u | Lowercase u | |
118 | 166 | 76 | 01110110 | v | v | 小寫字母 v | Lowercase v | |
119 | 167 | 77 | 01110111 | w | w | 小寫字母 w | Lowercase w | |
120 | 170 | 78 | 01111000 | x | x | 小寫字母 x | Lowercase x | |
121 | 171 | 79 | 01111001 | y | y | 小寫字母 y | Lowercase y | |
122 | 172 | 7A | 01111010 | z | z | 小寫字母 z | Lowercase z | |
123 | 173 | 7B | 01111011 | { | { | 左大括號 | Opening brace | |
124 | 174 | 7C | 01111100 | | | | | 垂直線 | Vertical bar | |
125 | 175 | 7D | 01111101 | } | } | 右大括號 | Closing brace | |
126 | 176 | 7E | 01111110 | ~ | ~ | 波浪號 | Equivalency sign - tilde | |
127 | 177 | 7F | 01111111 |  | 刪除 | Delete |
十進制 DEC | 八進制 OCT | 十六進制 HEX | 二進制 BIN | 符號 Symbol | HTML 實體編碼 | 中文解釋 Description | 英文解釋 Description | |
---|---|---|---|---|---|---|---|---|
128 | 200 | 80 | 10000000 | € | € | 歐盟符號 | Euro sign | |
129 | 201 | 81 | 10000001 | ? | ? | ? | ||
130 | 202 | 82 | 10000010 | ? | ‚ | 單低 9 引號 | Single low-9 quotation mark | |
131 | 203 | 83 | 10000011 | ? | ƒ | 帶鉤的 拉丁小寫字母f | Latin small letter f with hook | |
132 | 204 | 84 | 10000100 | ? | „ | 雙低 9 引號 | Double low-9 quotation mark | |
133 | 205 | 85 | 10000101 | … | … | 水平省略號 | Horizontal ellipsis | |
134 | 206 | 86 | 10000110 | ? | † | 劍號 | Dagger | |
135 | 207 | 87 | 10000111 | ? | ‡ | 雙劍號 | Double dagger | |
136 | 210 | 88 | 10001000 | ? | ˆ | 修正字符 抑揚音符號 | Modifier letter circumflex accent | |
137 | 211 | 89 | 10001001 | ‰ | ‰ | 千分號 | Per mille sign | |
138 | 212 | 8A | 10001010 | ? | Š | 帶彎音號的 拉丁大寫字母 S | Latin capital letter S with caron | |
139 | 213 | 8B | 10001011 | ? | ‹ | 左單書名號 | Single left-pointing angle quotation | |
140 | 214 | 8C | 10001100 | ? | Œ | 拉丁大寫組合 OE | Latin capital ligature OE | |
141 | 215 | 8D | 10001101 | ? | ? | ? | ||
142 | 216 | 8E | 10001110 | ? | Ž | 帶彎音號的 拉丁大寫字母 z | Latin capital letter Z with caron | |
143 | 217 | 8F | 10001111 | ? | ? | ? | ||
144 | 220 | 90 | 10010000 | ? | ? | ? | ||
145 | 221 | 91 | 10010001 | ‘ | ‘ | 左單引號 | Left single quotation mark | |
146 | 222 | 92 | 10010010 | ’ | ’ | 右單引號 | Right single quotation mark | |
147 | 223 | 93 | 10010011 | “ | “ | 左雙引號 | Left double quotation mark | |
148 | 224 | 94 | 10010100 | ” | ” | 右雙引號 | Right double quotation mark | |
149 | 225 | 95 | 10010101 | ? | • | ? | Bullet | |
150 | 226 | 96 | 10010110 | – | – | 半長破折號 | En dash | |
151 | 227 | 97 | 10010111 | — | — | 全長破折號 | Em dash | |
152 | 230 | 98 | 10011000 | ? | ˜ | 小波浪線 | Small tilde | |
153 | 231 | 99 | 10011001 | ? | ™ | ? | Trade mark sign | |
154 | 232 | 9A | 10011010 | ? | š | 帶彎音號的 拉丁小寫字母 s | Latin small letter s with caron | |
155 | 233 | 9B | 10011011 | ? | › | 右單書名號 | Single right-pointing angle quotation mark | |
156 | 234 | 9C | 10011100 | ? | œ | 拉丁小寫組合 oe | Latin small ligature oe | |
157 | 235 | 9D | 10011101 | ? | ? | ? | ||
158 | 236 | 9E | 10011110 | ? | ž | 帶彎音號的 拉丁小寫字母 z | Latin small letter z with caron | |
159 | 237 | 9F | 10011111 | ? | Ÿ | 帶彎音號的 拉丁大寫字母 Y | Latin capital letter Y with diaeresis | |
160 | 240 | A0 | 10100000 | ? |   | ? | Non-breaking space | |
161 | 241 | A1 | 10100001 | ? | ¡ | 反向感嘆號 | Inverted exclamation mark | |
162 | 242 | A2 | 10100010 | ¢ | ¢ | 分幣符號 | Cent sign | |
163 | 243 | A3 | 10100011 | £ | £ | 英磅符號 | Pound sign | |
164 | 244 | A4 | 10100100 | ¤ | ¤ | ? | Currency sign | |
165 | 245 | A5 | 10100101 | ¥ | ¥ | 人民幣符號 | Yen sign | |
166 | 246 | A6 | 10100110 | | | ¦ | ? | Pipe, Broken vertical bar | |
167 | 247 | A7 | 10100111 | § | § | 章節符號 | Section sign | |
168 | 250 | A8 | 10101000 | ¨ | ¨ | 通用貨幣符號 | Spacing diaeresis - umlaut | |
169 | 251 | A9 | 10101001 | ? | © | 版權符號 | Copyright sign | |
170 | 252 | AA | 10101010 | a | ª | 陰性順序 指示符號 | Feminine ordinal indicator | |
171 | 253 | AB | 10101011 | ? | « | 左角引號 | Left double angle quotes | |
172 | 254 | AC | 10101100 | ? | ¬ | ? | Not sign | |
173 | 255 | AD | 10101101 | - | ­ | ? | Soft hyphen | |
174 | 256 | AE | 10101110 | ? | ® | ? | Registered trade mark sign | |
175 | 257 | AF | 10101111 | ˉ | ¯ | ? | Spacing macron - overline | |
176 | 260 | B0 | 10110000 | ° | ° | 溫度符號 | Degree sign | |
177 | 261 | B1 | 10110001 | ± | ± | 加/減號 | Plus-or-minus sign | |
178 | 262 | B2 | 10110010 | 2 | ² | 上標 2 | Superscript two - squared | |
179 | 263 | B3 | 10110011 | 3 | ³ | 上標 3 | Superscript three - cubed | |
180 | 264 | B4 | 10110100 | ′ | ´ | ? | Acute accent - spacing acute | |
181 | 265 | B5 | 10110101 | μ | µ | 微符號 | Micro sign | |
182 | 266 | B6 | 10110110 | ? | ¶ | 段落符號, pilcrow | Pilcrow sign - paragraph sign | |
183 | 267 | B7 | 10110111 | · | · | 中點 | Middle dot - Georgian comma | |
184 | 270 | B8 | 10111000 | ? | ¸ | ? | Spacing cedilla | |
185 | 271 | B9 | 10111001 | 1 | ¹ | 上標 1 | Superscript one | |
186 | 272 | BA | 10111010 | o | º | 陽性順序 指示符 | Masculine ordinal indicator | |
187 | 273 | BB | 10111011 | ? | » | 右角引號 | Right double angle quotes | |
188 | 274 | BC | 10111100 | ? | ¼ | 分數四分之一 | Fraction one quarter | |
189 | 275 | BD | 10111101 | ? | ½ | 分數二分之一 | Fraction one half | |
190 | 276 | BE | 10111110 | ? | ¾ | ? | Fraction three quarters | |
191 | 277 | BF | 10111111 | ? | ¿ | 反向問號 | Inverted question mark | |
192 | 300 | C0 | 11000000 | à | À | 帶重音符 的大寫字母 A | Latin capital letter A with grave | |
193 | 301 | C1 | 11000001 | á | Á | 帶尖銳重音 的大寫字母 A | Latin capital letter A with acute | |
194 | 302 | C2 | 11000010 | ? | Â | 帶音調符號 的大寫字母 A | Latin capital letter A with circumflex | |
195 | 303 | C3 | 11000011 | ? | Ã | 帶代字號 的大寫字母 A | Latin capital letter A with tilde | |
196 | 304 | C4 | 11000100 | ? | Ä | 帶元音變音 (分音符號) 的大寫字母 A | Latin capital letter A with diaeresis | |
197 | 305 | C5 | 11000101 | ? | Å | 帶鈴聲 的大寫字母 A | Latin capital letter A with ring above | |
198 | 306 | C6 | 11000110 | ? | Æ | 大寫字母 AE 雙重元音 | Latin capital letter AE | |
199 | 307 | C7 | 11000111 | ? | Ç | 帶變音符號 的大寫字母 C | Latin capital letter C with cedilla | |
200 | 310 | C8 | 11001000 | è | È | 帶重音符 的大寫字母 E | Latin capital letter E with grave | |
201 | 311 | C9 | 11001001 | é | É | 帶尖銳重音 的大寫字母 E | Latin capital letter E with acute | |
202 | 312 | CA | 11001010 | ê | Ê | 帶音調符號 的大寫字母 E | Latin capital letter E with circumflex | |
203 | 313 | CB | 11001011 | ? | Ë | 帶元音變音 (分音符號) 的大寫字母 E | Latin capital letter E with diaeresis | |
204 | 314 | CC | 11001100 | ì | Ì | 帶重音符 的大寫字母 I | Latin capital letter I with grave | |
205 | 315 | CD | 11001101 | í | Í | 帶尖銳重音 的大寫字母 I | Latin capital letter I with acute | |
206 | 316 | CE | 11001110 | ? | Î | 帶音調符號 的大寫字母 I | Latin capital letter I with circumflex | |
207 | 317 | CF | 11001111 | ? | Ï | 帶元音變音 (分音符號) 的大寫字母 I | Latin capital letter I with diaeresis | |
208 | 320 | D0 | 11010000 | D | Ð | ? | Latin capital letter ETH | |
209 | 321 | D1 | 11010001 | ? | Ñ | 帶代字號 的大寫字母 N | Latin capital letter N with tilde | |
210 | 322 | D2 | 11010010 | ò | Ò | 帶重音符 的大寫字母 O | Latin capital letter O with grave | |
211 | 323 | D3 | 11010011 | ó | Ó | 帶尖銳重音 的大寫字母 O | Latin capital letter O with acute | |
212 | 324 | D4 | 11010100 | ? | Ô | 帶音調符號 的大寫字母 O | Latin capital letter O with circumflex | |
213 | 325 | D5 | 11010101 | ? | Õ | 帶代字號 的大寫字母 O | Latin capital letter O with tilde | |
214 | 326 | D6 | 11010110 | ? | Ö | 帶元音變音 (分音符號) 的大寫字母 O | Latin capital letter O with diaeresis | |
215 | 327 | D7 | 11010111 | × | × | 大寫字母 OE 連字 | Multiplication sign | |
216 | 330 | D8 | 11011000 | ? | Ø | 帶斜杠 的大寫字母 O | Latin capital letter O with slash | |
217 | 331 | D9 | 11011001 | ù | Ù | 帶重音符 的大寫字母 U | Latin capital letter U with grave | |
218 | 332 | DA | 11011010 | ú | Ú | 帶尖銳重音 的大寫字母 U | Latin capital letter U with acute | |
219 | 333 | DB | 11011011 | ? | Û | 帶音調符號 的大寫字母 U | Latin capital letter U with circumflex | |
220 | 334 | DC | 11011100 | ü | Ü | 帶元音變音 (分音符號) 的大寫字母 U | Latin capital letter U with diaeresis | |
221 | 335 | DD | 11011101 | Y | Ý | 帶元音變音 (分音符號) 的大寫字母 Y | Latin capital letter Y with acute | |
222 | 336 | DE | 11011110 | T | Þ | ? | Latin capital letter THORN | |
223 | 337 | DF | 11011111 | ? | ß | 德語高調 小寫字母 s | Latin small letter sharp s - ess-zed | |
224 | 340 | E0 | 11100000 | à | à | 帶重音符 的小寫字母 a | Latin small letter a with grave | |
225 | 341 | E1 | 11100001 | á | á | 帶尖銳重音 的小寫字母 a | Latin small letter a with acute | |
226 | 342 | E2 | 11100010 | a | â | 帶音調符號 的小寫字母 a | Latin small letter a with circumflex | |
227 | 343 | E3 | 11100011 | ? | ã | 帶代字號 的小寫字母 a | Latin small letter a with tilde | |
228 | 344 | E4 | 11100100 | ? | ä | 帶元音變音 (分音符號) 的小寫字母 a | Latin small letter a with diaeresis | |
229 | 345 | E5 | 11100101 | ? | å | 帶鈴聲的 小寫字母 a | Latin small letter a with ring above | |
230 | 346 | E6 | 11100110 | ? | æ | 小寫字母 ae 雙重元音 | Latin small letter ae | |
231 | 347 | E7 | 11100111 | ? | ç | 帶變音符號 的小寫字母 c | Latin small letter c with cedilla | |
232 | 350 | E8 | 11101000 | è | è | 帶重音符 的小寫字母 e | Latin small letter e with grave | |
233 | 351 | E9 | 11101001 | é | é | 帶尖銳重音 的小寫字母 e | Latin small letter e with acute | |
234 | 352 | EA | 11101010 | ê | ê | 帶音調符號 的小寫字母 e | Latin small letter e with circumflex | |
235 | 353 | EB | 11101011 | ? | ë | 帶元音變音 (分音符號) 的小寫字母 e | Latin small letter e with diaeresis | |
236 | 354 | EC | 11101100 | ì | ì | 帶重音符 的小寫字母 i | Latin small letter i with grave | |
237 | 355 | ED | 11101101 | í | í | 帶尖銳重音 的小寫字母 i | Latin small letter i with acute | |
238 | 356 | EE | 11101110 | ? | î | 帶音調符號 的小寫字母 i | Latin small letter i with circumflex | |
239 | 357 | EF | 11101111 | ? | ï | 帶元音變音 (分音符號) 的小寫字母 i | Latin small letter i with diaeresis | |
240 | 360 | F0 | 11110000 | e | ð | ? | Latin small letter eth | |
241 | 361 | F1 | 11110001 | ? | ñ | 帶代字號 的小寫字母 n | Latin small letter n with tilde | |
242 | 362 | F2 | 11110010 | ò | ò | 帶重音符 的小寫字母 o | Latin small letter o with grave | |
243 | 363 | F3 | 11110011 | ó | ó | 帶尖銳重音 的小寫字母 o | Latin small letter o with acute | |
244 | 364 | F4 | 11110100 | ? | ô | 帶音調符號 的小寫字母 o | Latin small letter o with circumflex | |
245 | 365 | F5 | 11110101 | ? | õ | 帶代字號 的小寫字母 o | Latin small letter o with tilde | |
246 | 366 | F6 | 11110110 | ? | ö | 帶元音變音 (分音符號) 的小寫字母 o | Latin small letter o with diaeresis | |
247 | 367 | F7 | 11110111 | ÷ | ÷ | 小寫字母 oe 連字 | Division sign | |
248 | 370 | F8 | 11111000 | ? | ø | 帶斜杠 的小寫字母 o | Latin small letter o with slash | |
249 | 371 | F9 | 11111001 | ù | ù | 帶重音符 的小寫字母 u | Latin small letter u with grave | |
250 | 372 | FA | 11111010 | ú | ú | 帶尖銳重音 的小寫字母 u | Latin small letter u with acute | |
251 | 373 | FB | 11111011 | ? | û | 帶音調符號 的小寫字母 u | Latin small letter u with circumflex | |
252 | 374 | FC | 11111100 | ü | ü | 帶元音變音 (分音符號) 的小寫字母 u | Latin small letter u with diaeresis | |
253 | 375 | FD | 11111101 | y | ý | 帶元音變音 (分音符號) 的小寫字母 y2 | Latin small letter y with acute | |
254 | 376 | FE | 11111110 | t | þ | ? | Latin small letter thorn | |
255 | 377 | FF | 11111111 | ? | ÿ | ? | Latin small letter y with diaeresis |
3、圖片形式
- 可顯示字符
可顯示字符編號范圍是32-126(0x20-0x7E),共95個字符。
- 控制字符
ASCII控制字符的編號范圍是0-31和127(0x00-0x1F和0x7F),共33個字符。
- 第一部分:ASCII非打印控制字符表
ASCII表上的數字0–31分配給了控制字符,用于控制像打印機等一些外圍設備。 - 第二部分:ASCII打印字符
數字 32–126 分配給了能在鍵盤上找到的字符,當您查看或打印文檔時就會出現。
- 第三部分:擴展ASCII打印字符
擴展的ASCII字符滿足了對更多字符的需求。
擴展的ASCII包含ASCII中已有的128個字符,又增加了128個字符,總共是256個。
即使有了這些更多的字符,許多語言還是包含無法壓縮到256個字符中的符號。因此,出現了一些ASCII的變體來囊括地區性字符和符號。例如,許多軟件程序把ASCII表(又稱作ISO8859-1)用于北美、西歐、澳大利亞和非洲的語言。
ASCII碼又分為: 標準ASCII碼和擴展ASCII碼。
-
標準ASCII碼
標準ASCII 碼也叫基礎ASCII碼,使用7 位二進制數來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊控制字符。-
其中0~31及127(共33個)是控制字符或通信專用字符(其余為可顯示字符),如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(響鈴)等;通信專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值為8、9、10 和13 分別轉換為退格、制表、換行和回車字符。它們并沒有特定的圖形顯示,但會依不同的應用程序,而對文本顯示有不同的影響。
-
32~126(共95個)是字符(32是空格),其中48~57為0到9十個阿拉伯數字。
65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其余為一些標點符號、運算符號等。
同時還要注意,在標準ASCII中,其最高位(b7)用作奇偶校驗位。
-
-
擴展ASCII碼
- 擴展ASCII 字符是從128 到255(0x80-0xff)的字符。許多基于x86的系統都支持使用擴展(或“高”)ASCII。它將每個字符的第8 位用于確定附加的128 個特殊符號字符、外來語字母和圖形符號。針對擴展的ASCII碼,不同的國家有不同的字符集,所以它并不是國際標準。
- 擴展ASCII 字符是從128 到255(0x80-0xff)的字符。許多基于x86的系統都支持使用擴展(或“高”)ASCII。它將每個字符的第8 位用于確定附加的128 個特殊符號字符、外來語字母和圖形符號。針對擴展的ASCII碼,不同的國家有不同的字符集,所以它并不是國際標準。
4、常用轉義字符
轉義字符 | 意義 | ASCII碼值(十進制) |
---|---|---|
\a | 響鈴(BEL) | 7 |
\b | 退格(BS) | 8 |
\f | 換頁(FF) | 12 |
\n | 換行(LF) | 10 |
\r | 回車(CR) | 13 |
\t | 水平制表(HT) | 9 |
\v | 垂直制表(VT) | 11 |
\\ | 反斜杠 | 92 |
\? | 問號字符 | 63 |
\' | 單引號字符 | 39 |
\" | 雙引號字符 | 34 |
\0 | 空字符(NULL) | 0 |
\ddd | 任意字符 | 三位八進制 |
\xhh | 任意字符 | 二位十六進制 |
5、ASCII、Unicode 和 UTF-8 之間的關系
5.1 ASCII 編碼
計算機內部,所有信息最終都是一個二進制值。每一個二進制位(bit)有0和1兩種狀態,因此八個二進制位就可以組合出256種狀態,這被稱為一個字節(byte)。也就是說,一個字節一共可以用來表示256種不同的狀態,每一個狀態對應一個符號,就是256個符號,從00000000到11111111。
上個世紀60年代,美國制定了一套字符編碼,對英語字符與二進制位之間的關系,做了統一規定。這被稱為 ASCII 碼,一直沿用至今。
ASCII 碼一共規定了128個字符的編碼,比如空格SPACE是32(二進制00100000),大寫的字母A是65(二進制01000001)。這128個符號(包括32個不能打印出來的控制符號),只占用了一個字節的后面7位,最前面的一位統一規定為0。
5.2 非 ASCII 編碼
英語用128個符號編碼就夠了,但是用來表示其他語言,128個符號是不夠的。比如,在法語中,字母上方有注音符號,它就無法用 ASCII 碼表示。于是,一些歐洲國家就決定,利用字節中閑置的最高位編入新的符號。比如,法語中的é的編碼為130(二進制10000010)。這樣一來,這些歐洲國家使用的編碼體系,可以表示最多256個符號。
5.3 Unicode
可以想象,如果有一種編碼,將世界上所有的符號都納入其中。每一個符號都給予一個獨一無二的編碼,那么亂碼問題就會消失。這就是 Unicode,就像它的名字都表示的,這是一種所有符號的編碼。
Unicode 當然是一個很大的集合,現在的規模可以容納100多萬個符號。每個符號的編碼都不一樣,比如,U+0639表示阿拉伯字母Ain,U+0041表示英語的大寫字母A,U+4E25表示漢字嚴。具體的符號對應表,可以查詢unicode.org,或者專門的漢字對應表。
需要注意的是,Unicode 只是一個符號集,它只規定了符號的二進制代碼,卻沒有規定這個二進制代碼應該如何存儲。
比如,漢字嚴的 Unicode 是十六進制數4E25,轉換成二進制數足足有15位(100111000100101),也就是說,這個符號的表示至少需要2個字節。表示其他更大的符號,可能需要3個字節或者4個字節,甚至更多。
它們造成的結果是:1)出現了 Unicode 的多種存儲方式,也就是說有許多種不同的二進制格式,可以用來表示 Unicode。2)Unicode 在很長一段時間內無法推廣,直到互聯網的出現。
5.4 UTF-8
互聯網的普及,強烈要求出現一種統一的編碼方式。UTF-8 就是在互聯網上使用最廣的一種 Unicode 的實現方式。其他實現方式還包括 UTF-16(字符用兩個字節或四個字節表示)和 UTF-32(字符用四個字節表示),不過在互聯網上基本不用。重復一遍,這里的關系是,UTF-8 是 Unicode 的實現方式之一。
UTF-8 最大的一個特點,就是它是一種變長的編碼方式。它可以使用1~4個字節表示一個符號,根據不同的符號而變化字節長度。
UTF-8 的編碼規則很簡單,只有二條:
1)對于單字節的符號,字節的第一位設為0,后面7位為這個符號的 Unicode 碼。因此對于英語字母,UTF-8 編碼和 ASCII 碼是相同的。
2)對于n字節的符號(n > 1),第一個字節的前n位都設為1,第n + 1位設為0,后面字節的前兩位一律設為10。剩下的沒有提及的二進制位,全部為這個符號的 Unicode 碼。
下表總結了編碼規則,字母x表示可用編碼的位:
Unicode符號范圍(十六進制) | UTF-8編碼方式(二進制) |
---|---|
0000 0000-0000 007F | 0xxxxxxx |
0000 0080-0000 07FF | 110xxxxx 10xxxxxx |
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx |
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx |
1)ANSI是默認的編碼方式。對于英文文件是ASCII編碼,對于簡體中文文件是GB2312編碼(只針對 Windows 簡體中文版,如果是繁體中文版會采用 Big5 碼)。
2)Unicode編碼這里指的是notepad.exe使用的 UCS-2 編碼方式,即直接用兩個字節存入字符的 Unicode 碼,這個選項用的 little endian 格式。
3)Unicode big endian編碼與上一個選項相對應。我在下一節會解釋 little endian 和 big endian 的涵義。
4)UTF-8編碼,也就是上一節談到的編碼方法。
5.5 Little endian 和 Big endian
UCS-2 格式可以存儲 Unicode 碼(碼點不超過0xFFFF)。以漢字嚴為例,Unicode 碼是4E25,需要用兩個字節存儲,一個字節是4E,另一個字節是25。存儲的時候,4E在前,25在后,這就是 Big endian 方式;25在前,4E在后,這是 Little endian 方式。
第一個字節在前,就是"大頭方式"(Big endian),第二個字節在前就是"小頭方式"(Little endian)。
那么很自然的,就會出現一個問題:計算機怎么知道某一個文件到底采用哪一種方式編碼?
Unicode 規范定義,每一個文件的最前面分別加入一個表示編碼順序的字符,這個字符的名字叫做"零寬度非換行空格"(zero width no-break space),用FEFF表示。這正好是兩個字節,而且FF比FE大1。
如果一個文本文件的頭兩個字節是FE FF,就表示該文件采用大頭方式;如果頭兩個字節是FF FE,就表示該文件采用小頭方式。
結語
如果您覺得該方法或代碼有一點點用處,可以給作者點個贊,或打賞杯咖啡;
╮( ̄▽ ̄)╭
如果您感覺方法或代碼不咋地//(ㄒoㄒ)//,就在評論處留言,作者繼續改進;
o_O???
如果您需要相關功能的代碼定制化開發,可以留言私信作者;
(????)
感謝各位大佬童鞋們的支持!
( ′ ▽′ )ノ ( ′ ▽′)っ!!!