基于kaggle提供的公開數據集,對全球葡萄酒分布情況和質量情況進行數據探索和分析
from kaggle:
https://www.kaggle.com/zynicide/wine-reviews
分析思路:
0、數據準備
1、葡萄酒的種類
2、葡萄酒質量
3、葡萄酒價格
4、葡萄酒描述詞庫
5、品鑒師信息
6、總結
0、數據準備
0.1 模塊及數據導入
導入所需數據模塊:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei'] #用來正常顯示中文標簽
plt.rcParams['axes.unicode_minus']=False #用來正常顯示負號
import seaborn as sns
導入數據,并檢查數據的完整性:
wine1=pd.read_csv('/Users/ranmo/Desktop/數據分析案例/Wine Reviews/wine-reviews/winemag-data_first150k.csv')
wine2=pd.read_csv('/Users/ranmo/Desktop/數據分析案例/Wine Reviews/wine-reviews/winemag