第三章 字符串%
字符串是不可變的,所有的元素賦值和切片賦值都是非法的
Python提供了多種字符串格式設置方法
yanyu = "hello, %s I like %s age is %s"
beyond = ("beyond","band",23)
yanyu % beyond#結果為:'hello, beyond I like band age is 23'a = "age is %.3f and name is %.2f"
b = (23,14)
a % b#結果為:'age is 23.000 and name is 14.00'
'''
很顯然,最后的%s對應的是數,但最后也會轉換成字符
如果指定的值不是字符串,將使用str將其轉換為字符串
beyond為值,需要插入到yanyu里面,yanyu % beyond位置不可以改變!!!
%.3f將值的格式設置為包含3位小數的浮點數
'''
from string import Template
tmpl = Template("Hello, $who! $what enough for ya?")
tmpl.substitute(who="yanyu", what="beyond") #結果為:'Hello, yanyu! beyond enough for ya?'
編寫新代碼時,應選擇使用字符串方法format,使用這種方法時,每個替換字段都用花括號括起
"{},{},and {}".format("apple","water","milk")#結果為:'apple,water,and milk'
"{0},{1},and {2}".format("aaa","bbb","ccc")#結果為:'aaa,bbb,and ccc'
"{0} {3} {1} {2}".format("a","b","c","d")#結果為:'a d b c'
格式說明符 .2f,并使用冒號:
將其與字段名隔開,意味著要使用包含2位小數的浮點數格式;若沒有指定,則輸出多位
from math import pi
"{name} is {value}.".format(value=pi, name="π")#結果為:'π is 3.141592653589793.'
"{name} is {value:.2f}.".format(value=pi, name="π")#結果為:'π is 3.14.'
from math import e
f"Euler's constant is roughly {e}."
"Euler's constant is roughly {e}.".format(e=e)'''
上述倆結果均一樣:
"Euler's constant is roughly 2.718281828459045."
'''
要在最終結果中包含花括號,可在格式字符串中使用兩個花括號(即{{或}})來指定
"{{ceci n'est pas une replacement field}}".format()#結果為:"{ceci n'est pas une replacement field}"
每個值都被插入字符串中,以替換用花括號括起的替換字段
替換字段由字段名、轉換標志、格式說明符組成其中每個部分都是可選的
替換字段名
"{foo} {} {bar} {}".format(1, 2, bar=4, foo=3)#結果為:'3 1 4 2'
"{foo} {1} {bar} {0}".format(1, 2, bar=4, foo=3)#結果為:'3 2 4 1'
name = ["huangjiaju","yanyu","yeshirong"]
"{band[1]} like the {band[0]} and {band[2]}".format(band=name)#結果為:'yanyu like the huangjiaju and yeshirong'
import math
temp1 = "The {mod.__name__} value is {mod.pi:.2f} for Π"
temp1.format(mod=math)#結果為:'The math value is 3.141592653589793 for Π'#變量__name__包含指定模塊的名稱temp2 = "The {mod.__name__} value is {mod.pi:.2f} for Π"
temp2.format(mod=math)#結果為:'The math value is 3.14 for Π'
1,基本轉換
三個標志(s、r和a)指定分別使用str、repr和ascii進行轉換
函數str通常創建外觀普通的字符串版本(這里沒有對輸入字符串做任何處理)
函數repr嘗試創建給定值的Python表示(這里是一個字符串字面量)
函數ascii創建只包含ASCII字符的表示,類似于Python 2中的repr
print("{pi!s} {pi!r} {pi!a}".format(pi="π"))
#結果為:π 'π' '\u03c0'
這里的f和b之類的表示類型說明符,具體的參考下表所述
"The number is {num}".format(num=42) #結果為:'The number is 42'
"The number is {num:f}".format(num=42) #結果為:'The number is 42.000000'
"The number is {num:.2f}".format(num=42) #結果為:'The number is 42.00'
"The number is {num:b}".format(num=42) #結果為:'The number is 101010'
類型 | 含 義 |
---|---|
b | 將整數表示為二進制數 |
c | 將整數解讀為Unicode碼點 |
d | 將整數視為十進制數進行處理,這是整數默認使用的說明符 |
e | 使用科學表示法來表示小數(用e來表示指數) |
E | 與e相同,但使用E來表示指數 |
f | 將小數表示為定點數 |
F | 與f相同,但對于特殊值(nan和inf),使用大寫表示 |
g | 自動在定點表示法和科學表示法之間做出選擇。這是默認用于小數的說明符,但在默認情況下至少有1位小數 |
G | 與g相同,但使用大寫來表示指數和特殊值 |
n | 與g相同,但插入隨區域而異的數字分隔符 |
o | 將整數表示為八進制數 |
s | 保持字符串的格式不變,這是默認用于字符串的說明符 |
x | 將整數表示為十六進制數并使用小寫字母 |
X | 與x相同,但使用大寫字母 |
% | 將數表示為百分比值(乘以100,按說明符f設置格式,再在后面加上%) |
2,寬度、精度和千位分隔符
設置浮點數(或其他更具體的小數類型)的格式時,默認在小數點后面顯示6位小數,并根據需要設置字段的寬度,而不進行任何形式的填充
字符串和數的默認對齊方式不同
數是默認右對齊;而字符串是默認左對齊
"{beyond:10}".format(beyond=2) #結果為:' 2'
"{name:10}".format(name="yanyu")#結果為:'yanyu '
'{:010.2f}'.format(pi)#結果為:'0000003.14'
# 010表示整體包括小數點共占十位且不足的話用0補齊,.2f表示小數點后2為小數,f為浮點數"PI day is {P:.2f}".format(P=pi)#結果為:'PI day is 3.14'
"{PI:10.2f}".format(PI=pi) #結果為:' 3.14'
"{:.5}".format("a ha haha") #結果為:'a ha '
"10 de yibaicifang is {:,}".format(10 ** 100)#結果為:'10 de yibaicifang is 10,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000' 千位分隔符
3,符號、對齊和用 0 填充
要指定左對齊、右對齊和居中,可分別使用<
、>
和^
print("{0:<10.2f}\n {0:^10.2f}\n {0:>10.2f}\n".format(pi))
'''
3.143.143.14
'''
填充字符來擴充對齊說明符,這樣將使用指定的字符而不是默認的空格來填充
"{:$^25}".format(" beyond yanyu ")#結果為:'$$$$$ beyond yanyu $$$$$$'
具體的說明符 = ,它指定將填充字符放在符號和數字之間
print('{0:10.2f}\n{1:10.2f}'.format(pi, -pi))
'''3.14-3.14
'''
print('{0:10.2f}\n{1:=10.2f}'.format(pi, -pi))
'''3.14
- 3.14
'''print('{0:+.2}\n{1:+.2}'.format(pi, -pi))
’‘’
+3.1
-3.1
‘’‘
print('{0:-.2}\n{1:-.2}'.format(pi, -pi)) #默認設置'''3.1
-3.1
#若{0}為pi是正數的話,{0:-.2}無法在pi前面添負號,最后的結果取決于format里面數的正負值'''
print('{0: .2}\n{1: .2}'.format(pi, -pi))
'''3.1
-3.1
'''
井號(#)選項,你可將其放在符號說明符和寬度之間
這個選項將觸發另一種轉換方式,轉換細節隨類型而異
對于二進制、八進制和十六進制轉換,將加上一個前綴
"{:b}".format(42)#結果為:'101010'
"{:#b}".format(42)#結果為:'0b101010'"{:g}".format(42)#結果為:'42'
"{:#g}".format(42)#結果為:'42.0000'
字符串方法
雖然字符串方法完全蓋住了模塊string的風頭,下面是模塊string中幾個很有用的常量
常量名稱 | 作用 |
---|---|
string.digits | 包含數字0~9的字符串 |
string.ascii_letters | 包含所有ASCII字母(大寫和小寫)的字符串 |
string.ascii_lowercase | 包含所有小寫ASCII字母的字符串 |
string.printable | 包含所有可打印的ASCII字符的字符串 |
string.punctuation | 包含所有ASCII標點字符的字符串 |
string.ascii_uppercase | 包含所有大寫ASCII字母的字符串 |
雖然說的是ASCII字符,但值實際上是未解碼的Unicode字符串
1,center,通過在兩邊添加填充字符(默認為空格)讓字符串居中
"字符串".center(num,"占位符")
#表示:將字符串一共占num個位置,然后在這num個位置居中,占位符填充,若無占位符默認空格填充
"beyond yanyu huangjiaju".center(25)#結果為:' beyond yanyu huangjiaju '
"beyond yanyu huangjiaju".center(25,"$")#結果為:'$beyond yanyu huangjiaju$'
2,find,在字符串中查找子串。如果找到,就返回子串的第一個字符的索引,否則返回-1
字符串方法find返回的并非布爾值
如果find像這樣返回0,就意味著它在索引0處找到了指定的子串
'With a moo-moo here, and a moo-moo there'.find('moo')#結果為:7title = "Monty Python's Flying Circus"
title.find('Monty')#結果為:0
title.find('Python')#結果為:6
title.find('Flying')#結果為:15
title.find('Zirquss')#結果為:-1subject = '$$$ Get rich now!!! $$$'
subject.find('$$$')#結果為:0
指定搜索的起點和終點(它們都是可選的),左閉右開
subject = '$$$ Get rich now!!! $$$'subject.find('$$$')#結果為:0
#只指定了起點
subject.find('$$$', 1)#結果為:20subject.find('!!!')#結果為:16
#同時指定了起點和終點
subject.find('!!!', 0, 16)#結果為:-1
3,join,其作用與split相反,用于合并序列的元素
所合并序列的元素必須都是字符串連接符.join(字符串列表)
將字符串列表通過連接符相連,連接符可為空
beyond = [1,9,9,3]
yy = ”+“
YY = ”“
yy.join(beyond)#結果為:報錯,原因是合并序列只能是字符串
sq = ['1','9','9','9']
yy.join(sq)#結果為:'1+9+9+9'
YY.join(sq)#結果為:'1999'dirs = '', 'usr', 'bin', 'env'
'/'.join(dirs)#結果為:'/usr/bin/env'
print('C:' + '\\'.join(dirs))#結果為:C:\usr\bin\env
4,lower,返回字符串的小寫版本
將所有的用戶名都轉換為小寫,并于搜索指定姓名用戶
name = "beyond"
names = ["yanyu","huangjiaju","yeshirong","beyond","huangguanzhoang","huangjiaqiang"]
if name.lower() in names:print("I found it!")
#結果為:I found it!
一個與lower相關的方法是title,它將字符串轉換為詞首大寫,即所有單詞的首字母都大寫,其他字母都小寫
與title功能一樣的是使用模塊string中的函數capwords
"i like beyond band".title()#結果為:'I Like Beyond Band'import string
string.capwords("i like beyond band")#結果為:'I Like Beyond Band'
5,replace,將指定子串
都替換為另一個字符串,并返回替換后的結果
'This is a test'.replace('is', 'eez')#結果為:'Theez eez a test'
6,split,一個非常重要的字符串方法,其作用與join相反,用于將字符串拆分
為序列
如果沒有指定分隔符,將默認在單個或多個連續的空白字符(空格、制表符、換行符
等)處進行拆分
'1+2+3+4+5'.split('+') #結果為”['1', '2', '3', '4', '5']
'/usr/bin/env'.split('/') #結果為:['', 'usr', 'bin', 'env']
'Using the default'.split() #結果為:['Using', 'the', 'default']
7,strip,將字符串開頭
和末尾
的空白(但不包括中間的空白)刪除,并返回刪除后的結果
' I very like beyond band '.strip()#結果為:'I very like beyond band'
假定用戶輸入用戶名時不小心在末尾加上了一個空格,搜索的時候就可以發揮這個方法的作用了
names = ['gumby', 'smith', 'jones']
name = 'gumby '
if name in names: print('Found it!')#結果為:按下enter 沒反應 因為用戶名稱多了個空格
if name.strip() in names: print('Found it!')#結果為:按下enter Found it!
還可在一個字符串參數中指定要刪除哪些字符
'*!*!###!!!!* SPAM * for * everyone!!! *@*$$$*'.strip(' #*!@$')#結果為:'SPAM * for * everyone'
8,translate,與replace一樣替換字符串的特定部分,但不同的是它只能進行單字符
替換
優勢在于能夠同時替換多個字符,因此效率比replace高
假設你要將一段英語文本轉換為帶有德國口音的版本,為此必須將字符c和s分別替換為k和z,使用translate前必須創建一個轉換表table = str.maketrans('cs', 'kz')
創建轉換表后,就可將其用作方法translate的參數
還可提供可選的第三個參數,指定要將哪些字母刪除
table1 = str.maketrans('cs', 'kz')
'this is an incredible test'.translate(table1)#結果為:thiz iz an inkredible tezt'table2 = str.maketrans('cs', 'kz', ' ')
'this is an incredible test'.translate(table2)#結果為:'thizizaninkredibletezt'
9,判斷字符串是否滿足特定的條件
isspace、isdigit和isupper,它們判斷字符串是否具有特定的性質
(如包含的字符全為
空白、數字或大寫)
如果字符串具備特定的性質,這些方法就返回True,否則返回False
YY = “BEYOND”
yy = "123456qwe"
q = " "
YY.isupper()#結果為:True
yy.isdigit()#結果為:False
q.isspace()#結果為:True
本章節介紹的新函數
函 數 | 描 述 |
---|---|
string.capwords(s[, sep]) | 使用split根據sep拆分s,將每項的首字母大寫,再以空格為分隔符將它們合并起來 |
ascii(obj) | 創建指定對象的ASCII表示 |