數據集網盤下載:
鏈接:https://pan.quark.cn/s/0e577858dba3?pwd=FJnb
提取碼:FJnb
代碼僅供參考
具體可打開ipynb文件進行學習和練習:
鏈接:https://pan.quark.cn/s/8efbe3061fad?pwd=T47B
提取碼:T47B
import pandas as pd
df = pd.read_csv('data/LJdata.csv')df.columns = ['district', 'address', 'title', 'house_type', 'area', 'price', 'floor', 'build_time', 'direction', 'update_time', 'view_num', 'extra_info', 'link']df.head()df.shapedf.info()# 需求1:找到最低的租金
df.sort_values('price', ascending=True).head(1)df.sort_values('price', ascending=False).head(1)# 需求2:找到面積最大的房源
df.sort_values('area', ascending=False).head(2)# 找到最近上新的房源
df.sort_values('update_time', ascending=False).head(3)
# 把看房人數不同的房源轉換成圖形顯示
import matplotlib.pyplot as plt
plt.hist(df['view_num'], bins=30) # bins:分段數
plt.show()# 查看看房人數最多的朝向
df.groupby('direction')['view_num'].sum().sort_values(ascending=False)# 繪制房源類型的數量
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
df.groupby('house_type')['price'].count().plot(kind = 'bar', figsize=(10,5))