GB2312/GBK是字符集嗎

GB2312/GBK 是字符集嗎?

是的,GB2312 和 GBBK 既是字符集(Character Set),也是編碼方式(Encoding)。它們不僅定義了可表示的字符范圍,還規定了這些字符在計算機中的二進制存儲格式。


1. 什么是字符集(Character Set)?

字符集是一個字符的集合,為每個字符分配一個唯一的編號(稱為代碼點碼位)。
例如:

  • ASCII 字符集:包含 128 個字符,A 的編號是 65(0x41)。
  • Unicode 字符集:包含全球字符, 的碼位是 U+4E2D

GB2312/GBK 也是字符集,因為它們:

  • 定義了支持的字符(如漢字、符號)。
  • 為每個字符分配了唯一的編號(如 在 GB2312 中的編號是 0xD6D0)。

2. 什么是編碼方式(Encoding)?

編碼方式規定了如何將字符的編號存儲為二進制數據
例如:

  • UTF-8 是 Unicode 的一種編碼方式,U+4E2D)編碼為 0xE4 0xB8 0xAD
  • GB2312/GBK 的編碼方式是直接用 2 字節表示字符編號(如 0xD6D0)。

GB2312/GBK 也是編碼方式,因為它們:

  • 規定了字符如何以字節形式存儲(固定 2 字節)。
  • 兼容 ASCII(單字節 0~127 與 ASCII 相同)。

3. GB2312/GBK 與 Unicode 的對比

特性GB2312/GBKUnicode
字符集是(定義中文字符和符號)是(全球字符)
編碼方式是(固定 2 字節存儲)否(需 UTF-8/16/32 實現編碼)
覆蓋范圍中文為主全球所有語言
兼容 ASCII是(單字節部分相同)是(UTF-8 完全兼容 ASCII)

4. 為什么說 GB2312/GBK 是“字符集+編碼”一體?

  • GB2312
    • 字符集:定義了 6763 個漢字 + 682 個符號。
    • 編碼:直接用 2 字節表示字符編號(如 0xB0A1)。
  • GBK
    • 字符集:擴展至 21886 個漢字(含繁體)。
    • 編碼:仍用 2 字節,但范圍更大(如 ?0x8140)。

它們的編號和存儲規則是綁定的,因此既是字符集,也是編碼方式


5. Unicode 與 GB2312/GBK 的關鍵區別

  • Unicode 是純字符集,需通過 UTF-8/16/32 實現編碼。
  • GB2312/GBK 是字符集+編碼一體,無需額外編碼規則。

示例

字符GBK 編碼(字符集+編碼)Unicode 碼點(僅字符集)UTF-8 編碼(Unicode 實現)
0xD6D0U+4E2D0xE4 0xB8 0xAD
A0x41(同 ASCII)U+00410x41

6. 常見誤區

  • 誤區:“GBK 是 Unicode 的一種編碼”。
    正解:GBK 是獨立體系,與 Unicode 無直接關系,但可通過映射表轉換。
  • 誤區:“字符集和編碼是分開的”。
    正解:GB2312/GBK 將二者結合,而 Unicode 將其分離(字符集 + 多種編碼方式)。

總結

  • GB2312/GBK 既是字符集,也是編碼方式,一體化的設計專門用于中文環境。
  • Unicode 是純字符集,需搭配 UTF-8/16/32 等編碼方式使用。
  • GBK 與 Unicode 可以互相轉換,但屬于不同體系。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/78163.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/78163.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/78163.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

BOM與DOM(解疑document window關系)

BOM(瀏覽器對象模型) 定義與作用 BOM(Browser Object Model)提供與瀏覽器窗口交互的接口,用于控制導航、窗口尺寸、歷史記錄等瀏覽器行為 window:瀏覽器窗口的頂層對象,包含全局屬性和方法&am…

水域陸地兩相宜,便攜漏電探測儀

在自然災害如洪水、地震、臺風及火災中,建筑物和電力設施易因結構破壞、線路老化或設備浸水導致絕緣失效,引發漏電事故。漏電不僅直接威脅人員生命安全,還可能引發二次火災或爆炸,尤其在潮濕環境下導電性增強,觸電風險…

c加加學習之day06->STL標準庫->day01

1.介紹:C 標準模板庫(Standard Template Library,簡稱 STL)是一組泛型編程的模板類和函數,旨在提供常用的數據結構、算法和函數對象。STL 是 C 標準庫的一部分,極大地提高了編程效率和代碼的可重用性。STL …

onnx注冊cpu版flashattention

摘要 本教程展示了如何在 ONNX Runtime 中注冊一個 CPU 可執行的 FlashAttention 算子。首先,可以直接升級到 ONNX Runtime v1.16 及以上,以獲得內置的 FlashAttention CPU 實現citeturn0search2;其次,演示了如何通過 ONNX Runtime 的 Custom Op 接口自定義實現并注…

3D高斯個人筆記

入門blog,參考視頻1和參考視頻2 球諧函數 通俗介紹或通俗介紹,3D高斯就是利用球諧函數(SH函數)作為基函數,去求取三維空間中不同點的顏色。 SH函數作為基函數通常是表示不同角度下的距離,即三維球面點半徑&#xff…

電子處方模塊開發避坑指南:從互聯網醫院系統源碼實踐出發

今天,筆者將結合互聯網醫院系統源碼實踐,從技術架構、合規策略、業務流程到性能優化,為大家梳理一份電子處方模塊開發避坑指南,助力各類醫療平臺高效落地電子處方功能。 一、為何電子處方模塊是互聯網醫院的“重災區”&#xff1…

【RabbitMQ | 第2篇】RabbitMQ 控制臺實現消息路由 + 數據隔離

文章目錄 同步調用和異步調用MQRabbitMQ1. RabbitMQ控制臺實現交換機路由到隊列1.1 創建隊列1.2 將消息發送給交換機,是否會到達隊列 2. RabbitMQ控制臺實現數據隔離2.1 添加一個用戶2.2 創建新的虛擬主機 同步調用和異步調用 同步調用是指完成一個功能&#xff0c…

kubernetes》》k8s》》Heml

Heml 下載地址 安裝 curl https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3 | bash# helm 添加 倉庫 # helm repo add 倉庫名稱 倉庫地址 helm repo add stable http://mirror.azure.cn/kubernetes/charts/# 查看helm 倉庫列表 helm repo list # 結…

【專題刷題】二分查找(一):深度解刨二分思想和二分模板

📝前言說明: 本專欄主要記錄本人的基礎算法學習以及LeetCode刷題記錄,按專題劃分每題主要記錄:(1)本人解法 本人屎山代碼;(2)優質解法 優質代碼;&#xff…

鄉村治理數字化平臺:信息技術賦能鄉村振興的深度探索

在信息化技術飛速發展的背景下,數字化轉型已成為推動社會進步和治理現代化的關鍵力量。鄉村治理數字化平臺,作為信息技術在鄉村治理領域的深度應用,正逐步成為提升鄉村治理效能、推動鄉村振興的重要工具。本文將深入探討鄉村治理數字化平臺的…

PyQt6基礎_QTabWidget

目錄 代碼 運行 官方文檔 PySide6.QtWidgets.QTabWidget - Qt for Python 代碼 class TempWidget(QWidget):def __init__(self):super().__init__()self.tabs QTabWidget()self.tabs.tabBarClicked.connect(self.tabs_tabBarClicked)widget_tab1 QWidget()widget_tab2…

springboot在eclipse里面運行 run as 是Java Application還是 Maven

在 Eclipse 里運行 Spring Boot 項目時,既可以選擇以“Java Application”方式運行,也可以通過 Maven 命令來運行,下面為你詳細介紹這兩種方式及適用場景。 以“Java Application”方式運行 操作步驟 在項目中找到帶有 SpringBootApplicat…

怎樣記憶Precision、Recall?

首先,明確符號: TP(True Posive):標簽為正,預測為正 TN(True Negative):標簽為負,預測為負 FP(False Positive):標簽為負,預測為正 FN(False Negative):標簽為正&#xf…

【C語言】C語言動態內存管理

前言 在C語言編程中,內存管理一直是程序員需要重點關注的領域。動態內存管理更是如此,它不僅涉及到內存的靈活分配和釋放,還隱藏著許多潛在的陷阱。本文將從動態內存分配的基礎講起,逐步深入到常見的錯誤、經典筆試題分析&#x…

expres路由模塊化

Express 路由模塊化是實際開發中非常重要的一部分,可以讓你的項目結構更清晰、維護更方便。 🧱 一、為什么要模塊化? 隨著項目變大,如果所有路由都寫在 app.js 中,會很亂。使用模塊化后可以: 功能解耦&a…

C語言——填充矩陣

C語言——填充矩陣 一、問題描述二、格式要求1.輸入形式2.輸出形式3.樣例 三、實驗代碼 一、問題描述 編程實現自動填充nn矩陣元素數值,填充規則為:從第一行最后一列矩陣元素開始按逆時針方向螺旋式填充數值1,2,…,nn…

零基礎上手Python數據分析 (22)案例實戰]之利用 Matplotlib Seaborn 進行電商銷售數據可視化分析

寫在前面 —— 圖表為刃,洞察先行!綜合運用 Pandas、Matplotlib 與 Seaborn,點亮數據價值 本篇通過一個完整的案例實戰,體驗如何將數據分析與數據可視化緊密結合,讓冰冷的數據轉化為生動、直觀、富有洞察力的視覺故事! 案例目標: 本篇博客將延續我們在第 17 篇案例中…

Java開發經驗總結

只要刪繁、捋清脈絡,才能掌握本質!只有創新才有價值,保持創新、保持學習! 計劃:UNIAPPSPRINGBOOT學習、SPRINGBOOTVUE新版學習、頁面展示學習、PYTHON。 ***********************************************************…

深入解析:RocketMQ、RabbitMQ和Kafka的區別與使用場景

互聯網大廠Java求職者面試:RocketMQ、RabbitMQ和Kafka的深入解析 故事場景:嚴肅且專業的面試官與架構師程序員馬架構 在一家知名的互聯網大廠,Java求職者正在接受一場嚴格的面試。面試官是一位經驗豐富的技術專家,他將通過多輪提…

使用vue2開發一個醫療預約掛號平臺-前端靜態網站項目練習

對于后端開發的我,最近一直在學習前端開發,除了要學習一些前端的基礎知識外,肯定少不了一些前端項目練習,就通過前端的編程知識 就簡單做一個醫療預約掛號前端靜態頁面。這個網站主要是使用了vue2 的相關技術實現的。 主要實現了這…