code point,code unit

2019獨角獸企業重金招聘Python工程師標準>>> hot3.png

從一段API描述談起: 在String的length的API中描述是這樣的!

lengthpublic int length()
Returns the length of this string. The length is equal to the number of 16-bit Unicode characters in the string.Specified by:
length in interface CharSequenceReturns:
the length of the sequence of characters represented by this object.

其中有一句話:

The length is equal to the number of 16-bit Unicode characters in the string.

直譯過來就是: length的大小和 16 bit 的Unicode字符的個數相同!

1、為什么是16bit?

Unicode是包括目前世界上幾乎所有語言的字符集,每一個字符對應的一個唯一編號,這個編號規則是:常用的Unicode稱謂:BMP,包含了大量的字符集,目前Unicode版本是8.0,BMP是U+0000-U+FFFF代表的字符集。當然了后期又擴展了很多。

可以看到BMP在U+0000-U+FFFF之間的字符,每一個字符的Unicode編碼對應的是四個16進制,每個16進制用四個bit表示,所以一個Unicode就是16 bit。

所以BMP內的字符都是由16Bit組成,所以有多少個16bit就有多少個字符。

[Unicode BMP](https://en.wikipedia.org/wiki/Plane_(Unicode) Unicode和UTF-8對應關系

2、String API codePoint什么意思?

每一個16bit的Unicode就是一個codePoint

關于code point、code unit的對應關系:

輸入圖片說明

wikipedia關于code_point

3、code unit是個什么概念?

The code unit size is equivalent to the bit measurement for the particular encoding:

A code unit in US-ASCII consists of 7 bits; A code unit in UTF-8, EBCDIC and GB18030 consists of 8 bits; A code unit in UTF-16 consists of 16 bits; A code unit in UTF-32 consists of 32 bits. 翻譯: 在US-ASCII中一個code unit代表7bits 在UTF-8,EBCDIC和GB18080中一個code unit代表8bits 在UTF-16中一個code unit代表16bits 在UTF-32中一個code unit代表32bits

總結:

code point是從unicode上定義的概念,是指一個字符集比如A代表的16bits。也就是字符的個數。

比如:

	String   s = "π王A23";//π用Unicode代表一個16bit的code point//王用Unicode代表一個16bit的code point//A用Unicode代表一個16bit的code point//2用Unicode代表一個16bit的code point//3用Unicode代表一個16bit的code pointSystem.out.println("字符串s的長度為:"+s.length());System.out.println("第三個code point為:"+s.codePointAt(2));

輸出:

	字符串s的長度為:5
第三個code point為:65

其中5代表5geunicode字符,每個字符是一個16bit的unicode。 65是代表字母A的標示。是第三個字符A

關于unicode學習最好的方式就是參考Wikipedia中的講述

轉載于:https://my.oschina.net/u/2525142/blog/618823

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/285630.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/285630.shtml
英文地址,請注明出處:http://en.pswp.cn/news/285630.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Android之解決JsonObject里面的JsonArray數據會有斜杠問題

1、問題 本地保存了多個json格式的字符串 {"event":"sdk_ad_request_status","timestamp":1640180549231,"ad_app_id":"10104","pool_test":0,"ad_type":0,"ad_request_time":0,"requ…

【土地評價與土地管理】案例:蘭州市榆中縣農用地分等

文章目錄 一、資料收集二、確定標準耕作制度、基準作物、指定作物、光溫(氣候生產潛力)三、劃分指標區,確定分等因素及權重四、編制“指定作物-分等因素-自然質量分”記分規則表五、繪制分等因素分值圖,劃分分等單元六、計算農用地自然質量分七、計算自然質量等指數八、計算…

.NET7之MiniAPI(特別篇) :Preview5優化了JWT驗證(下)

Preview5對策略驗證的方式沒有改變,只不過內置了Token的生成,和《.NET6之MiniAPI(十):基于策略的身份驗證和授權》的驗證方式基本相同,都是生成和驗證使用的驗證參數要一致,用繼承AuthorizationHandler的子類來作每次請…

業務多變的公司上云后蒸蒸日上

一、云服務器與傳統服務器的對比 1)、傳統服務器 傳統服務器是一個獨立的硬件設備,可以理解成是一臺放在機房的高配置電腦,可根據需求安裝各種操作系統以及配置各種環境,性能也比較強大。 2)、云服務器 云服務器是構建在硬件服務器集群之上,…

2016福州大學軟件工程第四次團隊作業-系統設計成績匯總

第四次團隊作業——系統設計打分統計結果如下: 學號組別團隊分數貢獻比例個人分數031401433606notconnected141613.83031402606606notconnected141413.33031402618606notconnected141814.34031402629606notconnected141413.33031402631606notconnected141914.590314…

[轉]在C#中像Python一樣編寫TensorFlow機器學習代碼

機器學習是一個令人激動人心的領域,一直有新的技術突破。研究人員不斷推動機器智能的提升,教機器如何聽說讀寫——這些曾經是我們人類專屬的技能。機器學習的首選語言是Python,最受歡迎的庫是Google的TensorFlow。幾乎所有的代碼示例都是用Py…

【土地評價與土地管理】教案 第一章:土地評價要素的選擇

文章目錄 1.1 土地構成要素與其農業利用1、光能條件2、熱量條件3、降水條件1.1 土地構成要素與其農業利用 1、光能條件 ? 光能是綠色植物進行光合作用和生物運動發展的主要能源 ? 太陽輻射、日照時數 ? 太陽輻射量隨地域和季節變化較大,導致了土地利用的多樣性和土地資源…

Blazor University (33)表單 —— EditContext、FieldIdentifiers

原文鏈接:https://blazor-university.com/forms/editcontext-fieldidentifiers-and-fieldstate/EditContext、FieldIdentifiers 和 FieldState請注意,對于那些希望了解 Blazor 如何“在后臺”工作的人來說,這是一個高級主題。無需了解此信息即…

Flutter之Container的寬度如何設置為手機屏幕寬度

1、問題 Container的寬度如何設置為手機屏幕寬度 2、解決辦法 width: MediaQuery.of(context).size.width,Row(children: [Container(height: 40,width: MediaQuery.of(context).size.width,// width: double.infinity,color: Colors.red,child: Row(children: [Containe…

團隊項目開發篇章8

例會時間:2016.11.3 整理:姬索肇 例會照片 每個人的工作 任務分配 我們今天與王鹿鳴學長和李云濤學長針對團隊開發過程中遇到的問題進行了討論,非常感謝學長們的熱心幫助,同時我們也被他們強大的編程能力所折服~ 在這里為學長們點…

MongoDB常用命令

啟動MongoDB$mongod --fork --logpath/data/log/r3.log--fork 允許mongod后臺運行,但是必須指定日志記錄文件路徑(Enables a daemon mode that runs the mongos process in the background.)--logpath 指定日志記錄文件路徑 導出Collections$…

【地理信息系統GIS】教案(七章全)第一章:地理信息系統概述

文章目錄 第一節 GIS基本概念第二節 GIS的組成第三節 GIS的功能第四節 GIS的發展第一節 GIS基本概念 1.1 GIS基本概念 1、信息 是用文字、數字、符號、語言、圖象、圖形等介質來表達事件、事物或現象等的內容、數量和特征,從而向人們(或系統)提供關于現實世界新的事實和知…

C# 讀寫ini文件 保存信息

/// <summary> /// 獲取本地信息 /// </summary> /// <returns></returns> private List<MHistoryKewWord> GetLocalHistoryKeyWords(){List<MHistoryKewWord> list new List<MHistoryKewWord>();var fs new FileStream("dat…

表達式的動態解析和計算,Flee用起來真香

前言在很多項目中經常會出現需要動態解析表達式和計算的場景&#xff0c;比如一些自動審核規則&#xff0c;或者是一些變量的值通過維護的公式在運行過程中動態算出&#xff1b;由于場景需求&#xff0c;都需要比較靈活的配置對應的表達式&#xff0c;然后希望在需要的時候能根…

C語言九十五之實現經典的反轉數組(通過指針或數組下標操作)

?作者簡介&#xff1a;大家好我是碼瑪莎拉蒂&#xff0c;CSDN博客專家&#x1f947;&#x1f947;&#x1f947; &#x1f4c3;個人主頁&#xff1a;個人主頁 &#x1f525;系列專欄&#xff1a;C語言試題200例 &#x1f4ac;推薦一款模擬面試、刷題神器&#x1f449; 點擊跳轉…

Linux下使用shell實現上傳linux下某個目錄下所有文件到ftp

首先我們需要搞清楚單個文件怎么上傳&#xff0c;把這個單文件上傳到ftp上的實現命名為一個:upload_to_ftp_command.sh 之后&#xff0c;需要弄清楚怎么實現遍歷一個目錄下的所有文件的&#xff0c;把這個遍歷某個目錄下的文件實現命名為&#xff1a;foeach_directory_and_uplo…

【地理信息系統GIS】教案(七章全)第二章:地理信息系統數據結構及數據獲取

文章目錄 第一節 地理空間及其表達第二節 空間數據采集第三節 屬性數據采集第四節 空間數據格式轉換第五節 空間數據質量第一節 地理空間及其表達 1.1 地理空間 地理空間上至大氣電離層,下至地幔莫霍面,是生命過程活躍的場所,也是宇宙過程對地球影響最大的區域。 地理信息…

[轉]Mysql數據庫開發的36條原則

前言 這些原則都是經歷過實戰總結而成 每一條原則背后都是血淋淋的教訓 這些原則主要是針對數據庫開發人員&#xff0c;在開發過程中務必注意 總是在災難發生后&#xff0c;才想起容災的重要性&#xff1b; 總是在吃過虧以后&#xff0c;才記得曾有人提醒過。 一、核心原則…

Kamp;R練習題6-1統計關鍵詞出現的次數

這道練習題訓練了&#xff1a; 1.結構體數組 2.二分查找 3.指針操作 ---- 都不難。但非常基礎&#xff0c;我認為非常好&#xff0c;做完了記到博客上來&#xff0c;題目見k&R&#xff0c;實現例如以下&#xff1a; /** Practice of struct array. K&R 6-1* author : w…

大話領域驅動設計——表示層及其他

概述表示層又稱用戶界面層&#xff0c;包含應用程序的頁面、組件等UI元素。服務層提供項目的HTTP API接口&#xff0c;包含MVC Controller和相關組件。ABP框架雖然在表示層提供了不少組件&#xff0c;但是這些和DDD本身沒有多少關系。而且隨著前后端分離架構的流行&#xff0c;…