python處理excel文件(xls和xlsx)

一、xlrd和xlwt

使用之前需要需要先安裝，windows上如果直接在cmd中運行python則需要先執行pip3 install xlrd和pip3 install xlwt，如果使用pycharm則需要在項目的解釋器中安裝這兩個模塊，File-Settings-Project:layout-Project Interpreter，點擊右側界面的＋號，然后搜索xlrd和xlwt，然后點擊Install Package進行安裝。

對于excel來說，整個excel文件稱為工作簿，工作簿中的每個頁稱為工作表，工作表又由單元格組成。

對于xlrd和xlwt，行數和列數從0開始，單元格的行和列也從0開始，例如sheet.row_values(2)表示第三行的內容，sheet.cell(1,2).value表示第二行第三列單元格的內容。

1.xlrd模塊讀取excel文件

使用xlrd模塊之前需要先導入import xlrd，xlrd模塊既可讀取xls文件也可讀取xlsx文件。

獲取工作簿對象：book = xlrd.open_workbook('excel文件名稱')

獲取所有工作表名稱：names = book.sheet_names()，結果為列表

根據索引獲取工作表對象：sheet = book.sheet_by_index(i)

根據名稱獲取工作表對象：sheet = book.sheet_by_name('工作表名稱')

獲取工作表行數：rows = sheet.nrows

獲取工作表列數：cols = sheet.ncols

獲取工作表某一行的內容：row =?sheet.row_values(i) ，結果為列表? ?【sheet.row(i)，列表】

獲取工作表某一列的內容：col =?sheet.col_values(i)? 結果為列表? ?【sheet.col(i)，列表】

獲取工作表某一單元格的內容：cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value，sheet.col(n)[m].value，結果為字符串或數值? ? 【sheet.cell(0,0)，xlrd.sheet.Cell對象】

示例：假設在py執行文件同層目錄下有一fruit.xls文件，有三個sheet頁Sheet1、Sheet2、Sheet3，其中Sheet1內容如下：

import xlrd
book = xlrd.open_workbook('fruit.xls')
print('sheet頁名稱:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncols
print('該工作表有%d行，%d列.'%(rows,cols))
print('第三行內容為:',sheet.row_values(2))
print('第二列內容為%s,數據類型為%s.'%(sheet.col_values(1),type(sheet.col_values(1))))
print('第二列內容為%s,數據類型為%s.'%(sheet.col(1),type(sheet.col(1))))
print('第二行第二列的單元格內容為:',sheet.cell_value(1,1))
print('第三行第二列的單元格內容為:',sheet.cell(2,1).value)
print('第五行第三列的單元格內容為:',sheet.row(4)[2].value)
print('第五行第三列的單元格內容為%s,數據類型為%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))
print('第五行第三列的單元格內容為%s,數據類型為%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 執行結果
# sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']
# 該工作表有5行，3列.
# 第三行內容為: ['梨', 3.5, 130.0]
# 第二列內容為['單價/元', 8.0, 3.5, 4.5, 3.8],數據類型為<class 'list'>.
# 第二列內容為[text:'單價/元', number:8.0, number:3.5, number:4.5, number:3.8],數據類型為<class 'list'>.
# 第二行第二列的單元格內容為: 8.0
# 第三行第二列的單元格內容為: 3.5
# 第五行第三列的單元格內容為: 300.0
# 第五行第三列的單元格內容為300.0,數據類型為<class 'float'>
# 第五行第三列的單元格內容為number:300.0,數據類型為<class 'xlrd.sheet.Cell'>

xlrd讀取excel示例

可以看出，通過sheet.row(i)、sheet.col(i)也可以獲取行或列的內容，并且結果也是一個列表，但是列表中的每一項類似字典的鍵值對，形式為數據類型:值

而sheet.cell(0,0)獲取單元格內容，結果是一個鍵值對，并且是一個xlrd.sheet.Cell對象。

2.xlwt寫入excel文件

使用xlwt模塊之前需要先導入import xlwt，xlwt模塊只能寫xls文件，不能寫xlsx文件(寫xlsx程序不會報錯，但最后文件無法直接打開，會報錯)。

創建工作簿：book = xlwt.Workbook()，如果寫入中文為亂碼，可添加參數encoding = 'utf-8'

創建工作表：sheet = book.add_sheet('Sheet1')

向單元格寫入內容：sheet.write(m,n,'內容1')、sheet.write(x,y,'內容2')

保存工作簿：book.save('excel文件名稱')，默認保存在py文件相同路徑下，如果該路徑下有相同文件，會被新創建的文件覆蓋，即xlwt不能修改文件。

import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')

xlwt創建并寫入excel示例

逐個單元格寫入excel比較麻煩，可以按行或者列寫入。

import xlwt
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','梨','香蕉','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
for i in range(0,len(proj)):sheet.write(0,i,proj[i]) #按行插入行標題
for i in range(0,len(fruit)):sheet.write(i+1,0,fruit[i])  #插入第一列水果名稱
for i in range(0,len(price)):sheet.write(i+1,1,price[i])  #插入第二列單價
for i in range(0,len(storage)):sheet.write(i+1,2,storage[i])   #插入第三列庫存
book.save('fruit2.xls')

xlwt逐行或列寫入excel

二、openpyxl模塊

openpyxl模塊可實現對excel文件的讀、寫和修改，只能處理xlsx文件，不能處理xls文件。使用openpyxl模塊之前同樣需要先安裝該模塊，再導入 import openpyxl。

對于openpyxl，行數和列數都從1開始，單元格的行和列也從0開始。例如sheet.cell(1,2).value表示第一行第二列單元格的內容

1.openpyxl讀取excel文件

獲取工作簿對象：book = openpyxl.load_workbook('excel文件名稱')

獲取所有工作表名稱：names = book.sheetnames

獲取工作表對象：sheet1 = book.worksheets[n]、sheet2 = book['工作表名稱']、sheet3 = book[book.sheetnames[n]]

獲取工作表名稱：title = sheet1.title

獲取工作表行數：rows = sheet1.max_row

獲取工作表列數：cols = sheet1.max_column

獲取某一單元格內容：cell =?sheet.cell(1,2).value、sheet['單元格'].value例如sheet['B1'].value

假設有一fruit2.xlsx，除后綴名其他與上述fruit.xls完全一樣

import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')
print('所有sheet頁名稱：',book.sheetnames)  
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]
print('工作表名稱：',sheet3.title)
rows = sheet.max_row
cols = sheet.max_column
print('該工作表有%d行，%d列.'%(rows,cols))# 執行結果
# 所有sheet頁名稱： ['Sheet1', 'Sheet2', 'Sheet3']
# 工作表名稱： Sheet1
# 該工作表有5行，3列.

openpyxl讀取excel示例

2.行和列生成器

對于xlrd模塊來說，可直接通過sheet.row[i]和sheet.col[i]獲取行和列的內容，但是對于openpyxl模塊來說，無法直接獲取某一行或列的內容，openpyxl模塊的sheet.rows和sheet.columns表示行和列的生成器，即generator object，需要通過循環或轉換成列表、元組的形式得到行或列的值。

print(sheet.rows,sheet.columns)
for col in sheet.columns:print(col)
for row in sheet.rows:for i in row:print(i.value,end='  ')print()# 執行結果
# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00>
# (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)
# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)
# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)
# 名稱  單價/元  庫存/kg
# 蘋果  8  150
# 梨  3.5  130
# 香蕉  4.5  100
# 橘子  3.8  300

openpyxl的行和列生成器

如果要獲取某一行或者列的內容，可將行、列生成器對象轉換成列表或者元組，再循環列表或者元組得到內容。

前面說過openpyxl模塊的行和列都從1開始，但是由于將生成器轉化成了列表list(sheet.rows)，而列表的索引從0開始，因此list(sheet.rows)[1]還是表示第二行的內容，不是第一行的內容。

for i in list(sheet.rows)[1]:print(i.value,end='  ')
print()
for i in list(sheet.columns)[0]:print(i.value,end='  ')# 執行結果
# 蘋果  8  150
# 名稱  蘋果  梨  香蕉  橘子

獲取某一行或者列的內容

獲取單元格的內容

print(sheet.cell(1,2).value)  #第一行第二列單元格的內容
print(sheet['a2'].value)  #使用excel單元格的表示法，字母不區分大小寫

3.openpyxl寫excel文件?

創建工作簿：book = openpyxl.Workbook()，如果寫入中文為亂碼，可添加參數encoding = 'utf-8'

創建工作表：sheet = book.create_sheet('工作表名稱',0)，0表示創建的工作表在工作薄最前面

向單元格寫入內容：sheet.write(m,n,'內容1')、sheet.write(x,y,'內容2')

保存工作簿：book.save('excel文件名稱')，默認保存在py文件相同路徑下，如果該路徑下有相同文件，會被新創建的文件覆蓋。

book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','香蕉','梨','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]
for i in range(len(proj)):sheet.cell(1,i+1,proj[i])
for i in range(len(fruit)):sheet.cell(i+2,1,fruit[i])
for i in range(len(price)):sheet.cell(i+2,2,price[i])
for i in range(len(storage)):sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')

openpyxl創建和寫excel示例

4.openpyxl修改excel文件

sheet.insert_rows(m)和sheet.insert_cols(n)分別表示在第m行、第n列前面插入行、列

sheet.delete_rows(m)和sheet.delete_cols(n)分別表示刪除第m行、第n列

rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['櫻桃',17,80]  
for j in cherry:sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')

openpyxl在指定位置增加行

修改單元格內容：sheet.cell(m,n) = '內容1'或者sheet['B3'] = '內容2'?

sheet.cell(3,2,4)
sheet['B3'] = 5
book.save('fruit2.xlsx')

openpyxl修改單元格的內容

在最后追加行：sheet.append(可迭代對象)

straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')

append在最后追加行

xlrd、xlwt和openpyxl處理excel文件，在寫入文件的時候不如pandas簡單，pandas處理excel文件見另外一篇博客https://www.cnblogs.com/Forever77/p/11298173.html

轉載于:https://www.cnblogs.com/Forever77/p/11135124.html