日常工作中,如果有數據庫權限,那么在oracle中提取數據、在Python中處理是比較方便的。Python也提供了一個庫專門操縱數據庫。今天就專門來講講如何在Python中操作數據庫。
準備工作
需要工具:oracle、PL/SQL、Python
import cx_Oracle
如果用anaconda prompt直接安裝的話,可能會出現錯誤。最好在網站cx-Oracle下載對應版本(我下載的如下):
下載好之后,直接點擊安裝包按照提示安裝即可。然后在anaconda里import。
SQL語言
先來復習一下幾個簡單的sql語句吧:
select * from table1 #查詢table1的所有數據
create table test_table( name varchar(20), score number) #創建表test_table,包含name、score兩列
insert into test_table(name,score) values('zoe',80) #插入一行數據
連接&操作數據庫連接數據庫
import cx_Oracle
import os
os.environ['NLS_LANG']='SIMPLIFIED CHINESE_CHINA.UTF8' #設置語言環境
db = cx_Oracle.connect('username','password','database') #連接數據庫 用戶名、密碼、數據庫名
cursor = db.cursor()
connect里填的,如下:創建表
create_table = """
create table py_table(
name varchar(20),
score number
)
""" #字符串里寫SQL語句,用三個雙引號括起來
create_flag = cursor.execute(create_table) #執行該SQL語句
運行完這兩句,可以在數據庫里看到新的表(如果沒有,可能要刷新或者重啟一下數據庫)。插入數據
insert_data1 = """
insert into py_table(name,score) values('zoe',80)
"""
cursor.execute(insert_data1) #執行SQL語句
db.commit() #提交插入多條數據
scores = {
'Tom':100,
'Lily':60,
'Emily':85
}
#第一種 循環
for i in scores.items(): #遍歷scores字典的鍵、值
cursor.execute('insert into py_table(name,score) values(:1,:2)',i) #i是一個元組,包含2個元素
#目前查到的方法,只能把所有列名寫出來,然后:1、:2、、、、傳入數據。
db.commit() #提交執行
#第二種 多條插入
scores1 = [(i,n) for i,n in scores.items()]
cursor.executemany('insert into py_table values(:1,:2)',scores1) # scores1是列表,里面是元組
db.commit() #提交執行
用executemany的速度會比第一種循環的要快,特別是數據多的時候。查詢數據
sql1 = cursor.execute('select * from py_table') #查詢數據
data1 = pd.DataFrame(sql1.fetchall()) #fetchall為取所有數據
data2 = sql1.fetchmany(10) #取10條數據綁定變量查詢
有時候查詢的條件是變化的,就需要用到綁定變量。
#查詢zoe的數據
sql = cursor.execute("""select * from py_table where name=:name""",name='zoe') #:name為綁定變量
data = sql.fetchall()
#in查詢
sql = cursor.execute("""select * from py_table where name in (:1,:2,:3)""",['zoe','Tom','Lily'])
data = sql.fetchall()
今天的連接Oracle數據庫學會了嗎?當然還有連接Mysql數據庫,不過使用的庫不一樣,大家可以自行百度。
用Python插入數據庫的時候,一定要注意數據的格式,如果與Oracle表的字段格式不匹配,就會出錯。
不過使用Python連接數據庫,最大的用處還是能方便在數據庫查詢數據,并且直接在Python中編程處理清洗了。
專欄列表