python數據類型所占字節數_python標準數據類型 Bytes

預備知識:

bin():

"""

Return the binary representation of an integer.

>>> bin(2796202)

'0b1010101010101010101010'

"""

pass

ord():

""" Return the Unicode code point for a one-character string. """

bytes類

"""

bytes(iterable_of_ints) -> bytes

bytes(string, encoding[, errors]) -> bytes

bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer

bytes(int) -> bytes object of size given by the parameter initialized with null bytes

bytes() -> empty bytes object

Construct an immutable array of bytes from:

- an iterable yielding integers in range(256)

- a text string encoded using the specified encoding

- any object implementing the buffer API.

- an integer

"""

python3中,字符串是unicode格式,字節包括utf-8,gbk等等,網絡傳輸,硬盤保存是以字節格式保存的。

str和bytes格式的區別:

str:

表現形式:a='hello,world'

內部原理:00000000 00000000 00000000 01101000 ‘h’

。。。

。。。

bytes:

表現形式:a=b'hello,world'

內部原理:

01101000 utf-8

。。。

。。。

00000000 01101000 gbk

。。。

。。。

Bytes 對象是由單個字節作為基本元素(8位,取值范圍 0-255)組成的序列,為不可變對象。

Bytes 對象只負責以二進制字節序列的形式記錄所需記錄的對象,至于該對象到底表示什么(比如到底是什么字符)則由相應的編碼格式解碼所決定。我們可以通過調用 bytes() 類(沒錯,它是類,不是函數)生成 bytes 實例,其值形式為 b'xxxxx',其中 'xxxxx' 為一至多個轉義的十六進制字符串(單個 x 的形式為:\xHH,其中 \x 為小寫的十六進制轉義字符,HH 為二位十六進制數)組成的序列,每兩個十六進制數即每個‘x’代表一個字節(八位二進制數,取值范圍 0-255),對于同一個字符串如果采用不同的編碼方式生成 bytes 對象,就會形成不同的值。

Python 3最重要的新特性大概要算是對文本和二進制數據作了更為清晰的區分。文本總是Unicode,由str類型表示,二進制數據則由bytes類型表示。Python 3不會以任意隱式的方式混用str和bytes,正是這使得兩者的區分特別清晰。你不能拼接字符串和字節包,也無法在字節包里搜索字符串(反之亦然),也不能將字符串傳入參數為字節包的函數(反之亦然 )。

例如:

a='你好'

a_b=a.encode('utf-8')

print(a_b)

for i in a_b:

print(i)

for i in a_b:

print(bin(i))

輸出:

b'\xe4\xbd\xa0\xe5\xa5\xbd' #原來如此,\xe4 長得這么丑,實際是十六進制的數字。和128,12,沒什么本質的區別。自然就可以bin()變為二進制數字了。

228

189

160

229

165

189

0b11100100

0b10111101

0b10100000

0b11100101

0b10100101

0b10111101

回到bytes和str的身上。bytes是一種比特流,它的存在形式是01010001110這種。我們無論是在寫代碼,還是閱讀文章的過程中,肯定不會有人直接閱讀這種比特流,它必須有一個編碼方式,使得它變成有意義的比特流,而不是一堆晦澀難懂的01組合。因為編碼方式的不同,對這個比特流的解讀也會不同,對實際使用造成了很大的困擾。下面讓我們看看Python是如何處理這一系列編碼問題的:

>>> s = "中文"

>>> s

'中文'

>>> type(s)

>>> b = bytes(s, encoding='utf-8')

>>>b

b'\xe4\xb8\xad\xe6\x96\x87'

>>> type(b)

從例子可以看出,s是個字符串類型。Python有個內置函數bytes()可以將字符串str類型轉換成bytes類型,b實際上是一串01的組合,但為了在ide環境中讓我們相對直觀的觀察,它被表現成了b'\xe4\xb8\xad\xe6\x96\x87'這種形式,開頭的b表示這是一個bytes類型。\xe4是十六進制的表示方式,它占用1個字節的長度,因此”中文“被編碼成utf-8后,我們可以數得出一共用了6個字節,每個漢字占用3個,這印證了上面的論述。在使用內置函數bytes()的時候,必須明確encoding的參數,不可省略。

我們都知道,字符串類str里有一個encode()方法,它是從字符串向比特流的編碼過程。而bytes類型恰好有個decode()方法,它是從比特流向字符串解碼的過程。除此之外,我們查看Python源碼會發現bytes和str擁有幾乎一模一樣的方法列表,最大的區別就是encode和decode。

從實質上來說,字符串在磁盤上的保存形式也是01的組合,也需要編碼解碼。

如果,上面的闡述還不能讓你搞清楚兩者的區別,那么記住下面兩幾句話:

在將字符串存入磁盤和從磁盤讀取字符串的過程中,Python自動地幫你完成了編碼和解碼的工作,你不需要關心它的過程。

使用bytes類型,實質上是告訴Python,不需要它幫你自動地完成編碼和解碼的工作,而是用戶自己手動進行,并指定編碼格式。

Python已經嚴格區分了bytes和str兩種數據類型,你不能在需要bytes類型參數的時候使用str參數,反之亦然。這點在讀寫磁盤文件時容易碰到。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/370825.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/370825.shtml
英文地址,請注明出處:http://en.pswp.cn/news/370825.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

java第六次作業

《Java技術》第六次作業 (一)學習總結 1.用思維導圖對本周的學習內容進行總結。 2.當程序中出現異常時,JVM會依據方法調用順序依次查找有關的錯誤處理程序。可使用printStackTrace 和getMessage方法了解異常發生的情況。閱讀下面的程序&#…

華為鴻蒙不再孤,華為鴻蒙OS系統不再孤單!又一款國產系統啟動內測:再掀國產替代化...

【5月10日訊】相信大家都知道,備受廣大花粉們期待的鴻蒙OS系統終于開始推送公測版本了,并且適配機型也開始不斷地增多,而根據華為官方最新消息,華為鴻蒙OS系統將會在6月份開始大規模推送正式版鴻蒙系統,這無疑將會成為…

Spring系列合并

Spring Collection合并是我第一次遇到的功能,它是對StackOverflow 問題的回答 這是一種創建基本集合(列表,集合,地圖或屬性)并在其他Bean中修改此基本集合的方法,下面通過一個示例對此進行最好的解釋- 考慮…

CSS 水平垂直居中

方法一&#xff1a; 容器確定寬高&#xff1a;知識點&#xff1a;transform只能設置在display為block的元素上。 <head> <meta charset"UTF-8"> <title>Title</title> <style type"text/css"> #container{…

linux怎么進入文件夾_Linux基礎命令《上》

上一節介紹了VMware中安裝centos7以及克隆系統&#xff0c;之中用到的幾個命名還都是開發不常用的&#xff0c;這節課就準備講解一下入門的Linux命名&#xff0c;都是日常使用的。首先呢&#xff0c;我們進入系統后&#xff0c;得先知道我是誰&#xff0c;我在哪兒&#xff1f;…

UML學習(一)-----用例圖

1、什么是用例圖 用例圖源于Jacobson的OOSE方法&#xff0c;用例圖是需求分析的產物&#xff0c;描述了系統的參與者與系統進行交互的功能&#xff0c;是參與者所能觀察和使用到的系統功能的模型圖。它的主要目的就是幫助開發團隊以一種可視化的方式理解系統的功能需求&#xf…

首款鴻蒙系統終端n,榮耀智慧屏正式發布,首款搭載鴻蒙系統終端,家庭C位新選擇...

原標題&#xff1a;榮耀智慧屏正式發布&#xff0c;首款搭載鴻蒙系統終端&#xff0c;家庭C位新選擇智能手機的普及率越來越高&#xff0c;其所能夠承擔的功能也越來越多&#xff0c;電視機對于很多中青年的用戶來講&#xff0c;更多的時候就是個擺設。在家庭中&#xff0c;看電…

oracle如何保證數據一致性和避免臟讀

oracle通過undo保證一致性讀和不發生臟讀 1.不發生臟讀2.一致性讀3. 事務槽&#xff08;ITL&#xff09;小解1.不發生臟讀 例如&#xff1a;用戶A對表更新了&#xff0c;沒有提交&#xff0c;用戶B對進行查詢&#xff0c;沒有提交的更新不能出現在用戶的查詢結果中 舉例并通個d…

Google Guava BloomFilter

當Guava項目發布版本11.0時&#xff0c;新添加的功能之一是BloomFilter類。 BloomFilter是唯一的數據結構&#xff0c;用于指示元素是否包含在集合中。 使BloomFilter有趣的是&#xff0c;它將指示元素是否絕對不包含或可能包含在集合中。 永遠不會出現假陰性的特性使BloomFil…

php 編程祝新年快樂_用于測試自動化的7種編程語言

導讀&#xff1a;本文重點介紹測試自動化中排名前七位的編程語言。當人們想要開始做自動化測試&#xff0c;此時卻需要開發自動化測試腳本&#xff0c;也就是要學習一門編程語言。那么&#xff0c;我們怎樣邁出這一步&#xff1f;也有你已經精通一種編程語言&#xff0c;也可以…

Day1 了解web前端

Day1 了解web前端 一.職業發展路線: 前端頁面制作、前端開發、前端架構師 二.1)前端工程師主要職責: 利用HTML/CSS/JavaScript等各種Web技術進行客戶端產品的開發。完成客戶端程序&#xff08;也就是瀏覽器端&#xff09;的開發&#xff0c;同時結合后臺技術模擬整體效果&am…

已阻止應用程序訪問圖形硬件_玩轉智能硬件之Jetson Nano(三)深度學習環境搭建...

0、前言iotboy&#xff1a;玩轉智能硬件&#xff08;一&#xff09;Jetson Nano安裝篇?zhuanlan.zhihu.comiotboy&#xff1a;玩轉智能硬件&#xff08;二&#xff09;Jetson Nano配置篇?zhuanlan.zhihu.com在玩轉智能硬件&#xff08;一&#xff09;和&#xff08;二&#x…

Vue.js開發環境搭建的介紹

包含了最基礎的Vue.js的框架&#xff0c;包含了打包工具和測試工具&#xff0c;開發調試的最基本的服務器&#xff0c;不需要關注細節&#xff0c;只需關注Vuejs對項目的實現 npm在國內的網絡使用較慢&#xff0c;所以推薦下載安裝淘寶的鏡像 1&#xff1a; 2&#xff1a;安裝c…

html文件轉換html格式,pdf文件怎么轉換成html格式

PDF文件怎么轉換成html格式呢&#xff1f;html格式其實就是網頁格式&#xff0c;PDF文件和網頁文件一般情況下是兩種完全不搭邊的格式&#xff0c;但是不可否定的是辦公室的多樣化總有人會有這樣的需求&#xff0c;只要有需求就會有其相應的解決方案。我們可以利用PDF轉Word一樣…

Eclipse中的Github Gists

我想描述有關在Eclipse中集成GitHub Gists的簡單步驟。 有幾個來源促使我這樣做&#xff1a; Eclipse的GitHub Mylyn連接器 EGit / GitHub /用戶指南 http://eclipse.github.com 我一直在使用Eclipse Java EE發行版&#xff0c;其中已經安裝了Mylyn插件&#xff1a; 1.通…

CSS3景深-perspective

3D視圖正方體&#xff1a; 1 <!DOCTYPE html>2 <html lang"en">3 <head>4 <meta charset"UTF-8">5 <title>CSS3景深-perspective</title>6 </head>7 <style>8 #div1{9 position: rel…

python pool_派松水潭(Python Pool)

派松水潭(Python Pool)旅游景點類型&#xff1a;名勝Roebourne Winternoom Road , Roebourne , Western Australia , 6718Email:roetourbigpond.net.auWebsite:www.pilbaracoast.com派松水潭(Python Pool)坐落于羅伯恩(Roebourne)以南風景如畫的米爾斯特姆-奇切斯特國家公園內。…

【BZOJ4262】Sum 單調棧+線段樹

【BZOJ4262】Sum Description Input 第一行一個數 t&#xff0c;表示詢問組數。第一行一個數 t&#xff0c;表示詢問組數。接下來 t 行&#xff0c;每行四個數 l_1, r_1, l_2, r_2。Output 一共 t 行&#xff0c;每行一個數 Sum。Sample Input 4 1 3 5 7 2 4 6 8 1 1 9 9 9 9 1…

父類一實現serializable_我的java基礎學習易錯點和易忘點總結(一)

一.繼承A:子類只能繼承父類所有非私有的成員(成員方法和成員變量)B:子類不能繼承父類的構造方法&#xff0c;但是可以通過super關鍵字去訪問父類構造方法。二.繼承中構造方法的關系A:子類中所有的構造方法默認都會訪問父類中空參數的構造方法B:為什么呢?因為子類會繼承父類中的…

Avocado 安裝和簡單測試

1.Avocado 安裝 1.1 通過包安裝 像Fedora可以通過rpm包進行安裝&#xff0c;其他通過RPM管理的發行版需要自己制作相關包。Avocado同樣支持DEP包的安裝可以在contrib/packages/debian找到。 Fedora 首先通過下面的命令獲取倉庫配置文件。 sudo curl https://repos-avocadoproje…