文章收集于網絡，如有版權，請聯系作者

一、引子

1 什么是數據？

x=10，10是我們要存儲的數據

2 為何數據要分不同的類型

數據是用來表示狀態的，不同的狀態就應該用不同的類型的數據去表示

3 數據類型

數字、字符串、列表、元組、字典、集合

二、基礎數據類型

2.1 數字 int

數字主要是用于計算用的，使用方法并不是很多，就記住一種就可以：
int() 可以把其他類型轉化為數字類型，并自動除去空格，但是前提是轉化的數字

# bit_length() 當十進制用二進制表示時，最少使用的位數
v = 11
data = v.bit_length()
print(data)

2.2 布爾值bool

布爾值就兩種：True，False

真 ? 1 ? True
假 ? 0 ? Falseint:0?? list:[]?? tuple:{}?? str:'' 轉化為布爾值是False，其他的都是True

2.3 字符串str

2.3.1?字符串的索引與切片。

索引即下標，就是字符串組成的元素從第一個開始，初始索引為0，以此類推。

a = 'ABCDEFGHIJK'
print(a[0])   # A
print(a[3])   # D
print(a[-1])  # K

切片就是通過索引（索引：索引：步長）截取字符串的一段，形成新的字符串（原則就是顧頭不顧腚）。

a = 'ABCDEFGHIJK'
print(a[0:3])
print(a[2:5])
print(a[0:])      # 默認到最后  ABCDEFGHIJK
print(a[0:-1])    # -1 是列表中最后一個元素的索引，但是要滿足顧頭不顧腚的原則，所以取不到K元素 
print(a[0:5:2])   # 加步長  ACE
print(a[5:0:-2])  # 反向加步長  FDB

2.3.2、字符串常用方法。

# 大小寫轉化 captalize,swapcase,title
name = 'flp'
print(name.capitalize())  # 首字母大寫
print(name.swapcase())    # 大小寫翻轉
msg='i love china'
print(msg.title())        # 每個單詞的首字母大寫# 內容居中 center
a1 = 'abcdefgabcd'
ret2 = a1.center(20,"*")  # 內容居中（總長度，空白處填充）
print(ret2)# 統計字符串出現元素個數 count
ret3 = a1.count("a",0,4)  # 字符串中的元素出現的個數，可切片(元素，開始位置，結束位置)
print(ret3)# \t補全
a2 = "hqw\t"
ret4 = a2.expandtabs()  # 默認將一個tab鍵變成8個空格，如果tab前面的字符長度不足8個，則補全8個，如果tab鍵前面的字符長度超過8個不足16個則補全16個，以此類推每次補全8個
print(ret4)# 判斷字符串開頭結尾 可切片startswith，endswith
a4 = "dkfjdkfasf54"
ret4 = a4.startswith('jdk',3,6)  # 判斷是否以...開頭，顧頭不顧腚，返回的是布爾值
print(ret4)
ret5 = a4.endswith("kfj",1,4)    # 判斷是否以...結尾，顧頭不顧腚，返回的是布爾值
print(ret5)# 判斷字符串中的元素是否存在 可切片find index
ret6 = a4.find("fjdk",1,6)      # 返回的找到的元素的索引，如果找不到返回-1
print(ret6)
ret61 = a4.index("fjdk",4,6)    # 返回的找到的元素的索引，找不到報錯
print(ret61)
# 注：在用find判斷字符不存在時，用下列的方式，因為不存在返回值是-1。
# if a4.find("fjdk",1,6) == -1# split 分割，最終形成一個列表此列表不含有這個分割的元素。
a5 = 'title,Tilte,atre,'
ret9 = a5.split('t')
print(ret9)     # 結果['', 'i', 'le,Til', 'e,a', 're,']
ret91 = a5.rsplit('t',1)
print(ret91)    # 結果['title,Tilte,a', 're,']
ret92 = a5.rsplit('t',2)
print(ret92)    # 結果['title,Til', 'e,a', 're,']# format的三種玩法 格式化輸出
res='{} {} {}'.format('egon',18,'male')      # 結果 egon,18,male
res='{1} {0} {1}'.format('egon',18,'male')   # 結果 18,egon,18
res='{name} {age} {sex}'.format(sex='male',name='egon',age=18)# strip切除字符串開頭或結尾的字符
name='*egon**'
print(name.strip('*'))   # 切除字符串開頭和結尾包含的*
print(name.lstrip('*'))  # 切除字符串開頭包含的*
print(name.rstrip('*'))  # 切除字符串結尾包含的*# replace字符串替換
name='flp China name is flp'
print(name.replace('flp','shuai',1))  #（要替換的字符串，替換成的字符串，替換的個數）# is系列
name='flp123'
print(name.isalnum())  # 字符串由字母或數字組成，返回布爾值
print(name.isalpha())  # 字符串只由字母組成，返回布爾值
print(name.isdigit())  # 字符串只由數字組成，返回布爾值# 判斷字符串是否為空
s=' '
if s.strip()=='':print('s is null')
# 或者
if not s.strip():print('s is null')

?2.4 元祖tuple

元組被稱為只讀列表，即數據可以被查詢，但不能被修改，所以，字符串的切片操作同樣適用于元組。例：（1，2，3）（"a","b","c"）

?2.5 列表list

列表是python中的基礎數據類型之一，其他語言中也有類似于列表的數據類型，比如js中叫數組，他是以[]括起來，每個元素以逗號隔開，而且他里面可以存放各種數據類型比如：

li = [123,Ture,(1,2,3,’abc’),[1,2,3,’小明’,],{‘name’:’abc’}]

列表相比于字符串，不僅可以儲存不同的數據類型，而且可以儲存大量數據，32位python的限制是 536870912 個元素,64位python的限制是 1152921504606846975 個元素。而且列表是有序的，有索引值，可切片，方便取值。

2.5.1、增

li = [1,'a','b',2,3,'a']
li.insert(0,55)          # 按照索引去增加
print(li)                # [55, 1, 'a', 'b', 2, 3, 'a']li.append('aaa')         # 增加到最后
li.append([1,2,3])
print(li)                # [55, 1, 'a', 'b', 2, 3, 'a', 'aaa', [1, 2, 3]]li.extend(['q,a,w'])     # 迭代的去增
li.extend(['q,a,w','aaa'])
li.extend('a')
li.extend('abc')
li.extend('a,b,c')
print(li)
# [55, 1, 'a', 'b', 2, 3, 'a', 'aaa', [1, 2, 3], 'q,a,w', 'q,a,w', 'aaa', 'a', 'a', 'b', 'c', 'a', ',', 'b', ',', 'c']

2.5.2、刪

li = [1,'a','b',2,3,'a']
l1 = li.pop(1)         # 按照位置去刪除，有返回值，返回被刪除的元素
print(l1,li)           # a [1, 'b', 2, 3, 'a']del li[1:3]            # 按照位置去刪除，也可切片刪除沒有返回值。
print(li)              # [1, 3, 'a']li.remove('a')         # 按照元素去刪除
print(li)              # [1, 3]li.clear()             # 清空列表

2.5.3、改

li = [1,'a','b',2,3,'a']
li[1] = 'dfasdfas'
print(li)             # [1, 'dfasdfas', 'b', 2, 3, 'a']li[1:3] = ['a','b']
print(li)             # [1, 'a', 'b', 2, 3, 'a']

2.5.4、查

切片去查，或者循環去查。

2.5.5、其他操作

# count 統計某個元素在列表中出現的次數
a = ["q","w","q","r","t","y"] print(a.count("q"))
# index 用于從列表中找出某個值第一個匹配項的索引位置
a = ["q","w","r","t","y"] print(a.index("r")) # sort 用于在原位置對列表進行排序，沒有返回值
a = [2,1,3,4,5] 
a.sort()        # 他沒有返回值，所以只能打印排序后的a 
print(a)# reverse 將列表中的元素反向存放，也沒有返回值
a.reverse()    # 他也沒有返回值，所以只能打印排序后的a 
print(a)

?2.6字典dict

字典是python中唯一的映射類型，采用鍵值對（key-value）的形式存儲數據。python對key進行哈希函數運算，根據計算的結果決定value的存儲地址，所以字典是無序存儲的，且key必須是可哈希的。可哈希表示key必須是不可變類型，如：數字、字符串、元組。

字典(dictionary)是除列表外，python之中最靈活的內置數據結構類型。列表是有序的對象結合，字典是無序的對象集合。兩者之間的區別在于：字典當中的元素是通過鍵來存取的，而不是通過偏移存取。

2.6.1、增

dic = {}
dic['li'] = ["a","b","c"]
print(dic)        # {'li': ['a', 'b', 'c']}
# setdefault 在字典中添加鍵值對，如果鍵對應的值是none,則添加；如果值不為空，則不會更改覆蓋。
dic.setdefault('k','v')
print(dic)        # {'age': 18, 'name': 'jin', 'sex': 'male', 'k': 'v'}
dic.setdefault('k','v1')  
print(dic)        # {'age': 18, 'name': 'jin', 'sex': 'male', 'k': 'v'}

2.6.2、刪

dic_pop = dic.pop("a",'無key默認返回值') # pop根據key刪除鍵值對，并返回對應的值，如果沒有key則返回默認返回值
print(dic_pop)del dic["name"]                         # 沒有返回值。
print(dic)dic_pop1 = dic.popitem()                # 隨機刪除字典中的某個鍵值對，將刪除的鍵值對以元祖的形式返回
print(dic_pop1)  dic_clear = dic.clear()                 # 清空字典
print(dic,dic_clear)                    # {} None

注：在循環字典本身的時候，不能刪除字典的鍵值對

2.6.3、改

dic = {"name":"jin","age":18,"sex":"male"}
dic2 = {"name":"alex","weight":75}
dic2.update(dic)      # 將dic所有的鍵值對覆蓋添加（相同的覆蓋，沒有的添加）到dic2中
print(dic2)           # {'name': 'jin', 'weight': 75, 'age': 18, 'sex': 'male'}

2.6.4、查

value1 = dic["name"]  # 沒有會報錯
print(value1)value2 = dic.get("djffdsafg","默認返回值")  # 沒有可以返回設定的返回值
print(value2)

2.6.5、其他操作

item = dic.items()
print(item,type(item))  
# dict_items([('age', '18'), ('sex', 'male')) <class 'dict_items'>這個類型就是dict_items類型，可迭代的keys = dic.keys()
print(keys,type(keys))      # dic的所有kvalues = dic.values()
print(values,type(values))  # dic的所有值# 字典的循環。
dic = {"age":18,"sex":"male"}
for key in dic:print(key)
for item in dic.items():print(item)
for key,value in dic.items():print(key,value)# 判斷值是否在字典中
if 'age' in dic.keys: 
if 'age' in dic:# fromkeys(seq[, value]) 函數用于創建一個新字典，以序列 seq 中元素做字典的鍵，value 為字典所有鍵對應的初始值。
dict.fromkeys(seq[, value])seq -- 字典鍵值列表。value -- 可選參數, 設置鍵序列（seq）的值。seq = ('Google', 'Runoob', 'Taobao')
dict = dict.fromkeys(seq)
print "新字典為 : %s" %  str(dict)
# 新字典為 : {'Google': None, 'Taobao': None, 'Runoob': None}dict = dict.fromkeys(seq, 10)
print "新字典為 : %s" %  str(dict)
# 新字典為 : {'Google': 10, 'Taobao': 10, 'Runoob': 10}

?2.7?集合set

集合：可變的數據類型，他里面的元素必須是不可變(可哈希)的數據類型，無序，不重復

去重：把一個列表變成集合會自動去重

關系測試是，測試兩組數據之前的交集，差集，并集等關系

創建

set1 = set(1,2,abc)

增

set1.add('dong')
set1.update([1,2,3])

刪

set1.remove('a') # 刪除一個元素
set1.pop('b')    # 隨機刪除一個，有返回值，返回值為刪除的元素
set1.clear()     # 清除set
del set1         # 刪除set1

查

for i in set1 :print(i)

關系測試

set1 = {1,2,3,4,'a'}
set2 = {'a','b','c','d',1}
print(set1 & set2)    
print(set1.intersection(set2)) # 交集{1, 'a'}print(set1 | set2)    
print(set2.union(set1))        # 并集{1, 2, 3, 4, 'd', 'b', 'c', 'a'}print(set1 - set2)    
print(set1.symmetric_difference(set2)) # 差集，set1獨有的{2, 3, 4}print(set1 ^ set2)    
print(set1.difference(set2))   # 反交集{2, 3, 4, 'c', 'd', 'b'}print(set1 > set2)    
print(set1.issubset(set2))     # 這兩個相同，都是說明set1是set2子集。print(set2 < set2)
print(set2.issuperset(set1))   # 這兩個相同，都是說明set2是set1超集。

三丶基礎數據類型的總結

按存儲空間的占用分（從低到高）

數字

字符串

集合：無序，即無序存索引相關信息

元組：有序，需要存索引相關信息，不可變

列表：有序，需要存索引相關信息，可變，需要處理數據的增刪改

字典：無序，需要存key與value映射的相關信息，可變，需要處理數據的增刪改

按存值個數區分

標量／原子類型	數字，字符串
容器類型	列表，元組，字典

按可變不可變區分

可變	列表，字典
不可變	數字，字符串，元組，布爾值

按訪問順序區分

直接訪問	數字
順序訪問（序列類型）	字符串，列表，元組
key值訪問（映射類型）	字典

四丶其他（for，enumerate，range）

for循環：用戶按照順序循環可迭代對象的內容。

msg = 'Lepeng最帥'
for item in msg:print(item)li = ['趙','錢','孫','李']
for i in li:print(i)dic = {'name':'Lepeng','age':18,'sex':'man'}
for k,v in dic.items():print(k,v)

enumerate：枚舉，對于一個可迭代的（iterable）/可遍歷的對象（如列表、字符串），enumerate將其組成一個索引序列，利用它可以同時獲得索引和值。

li = ['趙','錢','孫','李']
for i in enumerate(li):print(i)
for index, name in enumerate(li, 100):  # 起始位置默認是0，可更改print(index, name)
# 100 趙
# 101 錢
# 102 孫
# 103 李

range：指定范圍，生成指定數字。

for i in range(1,10):print(i)for i in range(1,10,2):  # 步長print(i)

join：用于將序列中的元素以指定的字符連接生成一個新的字符串。

語法：? 'sep'.join(seq)

參數說明

sep：分隔符，可以為空

seq：要連接的元素序列、字符串、元組、字典

上面的語法即：以sep作為分隔符，將seq所有的元素合并成一個新的字符串,然后返回

示例
s1 = "-"
s2 = ""
seq = ("r", "u", "n", "o", "o", "b") # 字符串序列
print (s1.join( seq ))    # r-u-n-o-o-b
print (s2.join( seq ))    # runoob

五，判斷是否是字符串，字典等（isinstance）

在實際寫程序中，經常要對變量類型進行判斷，除了用type(變量)這種方法外，還可以用isinstance方法判斷：

#!/usr/bin/env python
a = 1
b = [1,2,3,4]
c = (1,2,3,4)
d = {'a':1,'b':2,'c':3}
e = "abc"
if isinstance(a,int):print "a is int"
else:print "a is not int"
if isinstance(b,list):print "b is list"
else:print "b is not list"
if isinstance(c,tuple):print "c is tuple"
else:print "c is not tuple"
if isinstance(d,dict):print "d is dict"
else:print "d is not dict"
if isinstance(e,str):print "d is str"
else:print "d is not str"

六丶相互轉化

# 1、字典
dict1 = {'name': 'Zara', 'age': 7, 'class': 'First'}
# 字典轉為字符串，返回：<type 'str'> {'age': 7, 'name': 'Zara', 'class': 'First'}
print(type(str(dict1)), str(dict1))
# 字典可以轉為元組，返回：('age', 'name', 'class')
print(tuple(dict1))
# 字典可以轉為元組，返回：(7, 'Zara', 'First')
print(tuple(dict1.values()))
# 字典轉為列表，返回：['age', 'name', 'class']
print(list(dict1))
# 字典轉為列表，返回：['Zara', 7, 'First']
print(list(dict1.values()))# 2、元組
tup=(1, 2, 3, 4, 5)
# 元組轉為字符串，返回：(1, 2, 3, 4, 5)
print(tup.__str__())
# 元組轉為列表，返回：[1, 2, 3, 4, 5]
print(list(tup))
# 元組不可以轉為字典# 3、列表
nums=[1, 3, 5, 7, 8, 13, 20];
# 列表轉為字符串，返回：[1, 3, 5, 7, 8, 13, 20]
print(str(nums))
# 列表轉為元組，返回：(1, 3, 5, 7, 8, 13, 20)
print(tuple(nums))
# 列表不可以轉為字典# 4.1、字符串之eval函數，此函數有風險，需慎用，此函數的參數可以是系統命令，所以會存在風險
# 字符串轉為元組，前提是字符串像元組,返回：(1, 2, 3)
print(eval("(1,2,3)"))
# 字符串轉為列表，前提是字符串像列表,返回：[1, 2, 3]
print(eval("[1,2,3]"))
# 字符串轉為字典，前提是字符串像字典,返回：{'name': 'ljq', 'age': 24}
print(eval("{'name':'ljq', 'age':24}"))# 4.2、字符串轉換其他方式
# 字符串轉為列表，結果['', 'i', 'le,Til', 'e,a', 're,']
a5 = 'title,Tilte,atre,'
print(a5.split('t'))# 字符串轉為字典
s = "Name1=Value1;Name2=Value2;Name3=Value3"
d = dict(item.split("=") for item in s.split(";"))
print(d)
# 結果為dict = { "Name1": "Value1", "Name2": "Value2", "Name3": "Value3" }，
# 注意s結尾不能是;如果是，用s.rstrip(';')

七，注意事項

如果元組只有一個元素，如果不加逗號，此元素是什么類型，則就是什么類型，如果元組只用（）表示，也不存在此情況；list，字典不存在此情況

tu1 = ()? ? ? ? ? ? ?# <class ''tuple'>
tu2 = (1)? ? ? ? ? ? # <class 'int'>
tu3 = (1,)? ? ? ? ? ?# <class 'tuple'>list1 = ['a']? ? ? ??#?<class 'list'>
list2 = []? ? ? ? ? ?#?<class 'list'>

八丶深淺copy

1，先看賦值運算

l1 = [1,2,3,['AB','ab']]
l2 = l1l1[0] = 111
print(l1)    # [111, 2, 3, ['AB', 'ab']]
print(l2)    # [111, 2, 3, ['AB, 'ab']]l1[3][0] = 'EEE'
print(l1)    # [111, 2, 3, ['EEE', 'ab']]
print(l2)    # [111, 2, 3, ['EEE', 'ab']]

對于賦值運算來說，l1與l2指向的是同一個內存地址，所以他們是完全一樣的。

2，淺拷貝copy

# 同一代碼塊下：
l1 = [1, 'abc', True, (1,2,3), [22, 33]]
l2 = l1.copy()
print(id(l1), id(l2))          # 2713214468360 2713214524680 不同
print(id(l1[-2]), id(l2[-2]))  # 2547618888008 2547618888008 相同
print(id(l1[-1]),id(l2[-1]))   # 2547620322952 2547620322952 相同# 不同代碼塊下：
l1 = [1, 'abc', True, (1, 2, 3), [22, 33]]
l2 = l1.copy()
print(id(l1), id(l2))         # 1477183162120 1477183162696 不同
print(id(l1[-2]), id(l2[-2])) # 1477181814032 1477181814032 相同
print(id(l1[-1]), id(l2[-1])) # 1477183162504 1477183162504 相同

對于淺copy來說，只是在內存中重新創建了開辟了一個空間存放一個新列表，但是新列表中的元素與原列表中的元素是公用的。

3，深拷貝deepcopy。

# 同一代碼塊下
import copy
l1 = [1, 'abc', True, (1,2,3), [22, 33]]
l2 = copy.deepcopy(l1)
print(id(l1), id(l2))         # 2788324482440 2788324483016 不同
print(id(l1[0]),id(l2[0]))    # 1470562768 1470562768 相同
print(id(l1[-1]),id(l2[-1]))  # 2788324482632 2788324482696 不同
print(id(l1[-2]),id(l2[-2]))  # 2788323047752 2788323047752 相同# 不同代碼塊下
import copy
l1 = [1, 'abc', True, (1, 2, 3), [22, 33]]
l2 = copy.deepcopy(l1)
print(id(l1), id(l2))         # 1477183162824 1477183162632 不同
print(id(0), id(0))           # 1470562736 1470562736 相同
print(id(-2), id(-2))         # 1470562672 1470562672 相同
print(id(l1[-1]), id(l2[-1])) # 1477183162120 1477183162312 不同

對于深copy來說，列表是在內存中重新創建的，列表中可變的數據類型是重新創建的，列表中的不可變的數據類型是公用的。

八、小數據池

小數據池。一種數據緩存機制. 也被稱為駐留機制. 各大編程語?中都有類似的東西.

小數據池只針對: 整數, 字符串, 布爾值. 其他的數據類型不存在，如列表，元祖等，即使里面只有一個值，賦值時內存地址不一樣

在python中對-5到256之間的整數會被駐留留在內存中. 將一定規則的字符串緩存. 在使用的時候, 內存中只會創建一個該數據的對象. 保存在小數據池中. 當使用的時候直接從小數據池中獲取對象的內存引用. 而不需要創建一個新的數據. 這樣會節省更多的內存區域.

優點: 能夠提?一些字符串, 整數的處理速度. 省略創建對象的過程.
缺點: 在’池’中創建或者插入新的內容會花費更多的時間.

對于數字:

?-5~256是會被加到小數據池中的. 每次使用都是同一個對象. 例如：

a,b=100,100

print(a is b)? ? ?#True

對于字符串:

如果字符串的長度是0或者1, 都會默認進行緩存

字符串長度大于1, 但是字符串中只包含字母, 數字, 下劃線時才會緩存，無論字符串長度大小

用乘法得到的字符串.

??????? ①. 乘數等于1, 僅包含數字, 字母, 下劃線時會被緩存. 如果包含其他字符, 而長度<=1 也會被駐存,

??????? ②. 乘數大于1, 僅包含數字, 字母, 下劃線時會被緩存. 但字符串長度不能大于20 ，大于20不會緩存

指定駐留. 我們可以通過sys模塊中的intern()函數來指定要駐留留的內容.

到目前為止. 我們已經了解了了python的小數據池的一些基本情況了. 但是!!!! 還有最后一個問題. 小數據池和最開始的代碼塊有什么關系呢? 同樣的一段代碼在命令行窗口和在py文件中. 出現的效果是完全不一樣的。在代碼塊內的緩存機制是不一樣的.

在執行同一個代碼塊的初始化對象的命令時, 會檢查其值是否已經存在, 如果存在, 會將其重用. 換句話說: 執行同一個代碼塊時, 遇到初始化對象的命令時，他會將初始化的這個變量與值存儲在一個字典中, 在遇到新的變量時, 會先在字典中查詢記錄, 如果有同樣的記錄那么它會重復使用這個字典中的之前的這個值. 所以在文件執行時(同一個代碼塊) 會把a, b兩個變量量指向同?一個對象.
如果是不同的代碼塊, 他就會看這個兩個變量是否滿足小數據池的數據, 如果是滿足小數據池的數據則會指向同一個地址. a, b的賦值語句分別被當作兩個代碼塊執行, 但是他們不滿足小數據池的數據所以會得到兩個不同的對象, 因而is判斷返回False.

= 為賦值，賦予的是內存地址
is：比較的是內存地址。
id：比較的id是否相同。
==：比較兩個值是否相等。