字符編碼
-
什么是計算機編碼
計算機只能處理二進制的數據,其它的數據都要進行轉換,但轉換必須要有一套字符編碼(是字符與二進制的一個對應關系)。常用的字符:a-z、0-9、其它的符號等,計算機也不能直接處理。
(字符編碼類似于翻譯的字典)
-
常用的計算機編碼(字符集、字符編碼)
ASCII編碼:American Standard Code for Information Interchange美國信息交換標準代碼
用1個字節(7位或8位二進制)來表示一個字符。比如:字母a,用二進制表示01100001
- ANSI編碼:其它國家為了顯示本國的語言,都對ASCII碼進行了擴展,加入了本國的語言編碼。
- ANSI編碼都是用兩個字節(16位二進制)來表示一個漢字。
- ANSI編碼跟操作系統有直接關系,你安裝什么操作系統,那你的ANSI編碼就是相應的編碼。
例如:我們安裝的是中文操作系統,對應的默認編碼GB2312。
- GB2312編碼:對6763個常用漢字和682個全角字符進行了編碼。GB2312編碼用兩個字節表示一個漢字,所以理論上最多可以表示2^16=65536個漢字。
- GBK編碼:對GB2312進行了擴展,用于顯示一些罕見的漢字。
- BIG5編碼:繁體漢字編碼
- JIS編碼:日本文字編碼
?