問題背景
將網頁的表格內容(5237個股票信息)復制粘貼到excel文件中
網址:A股上市公司名單-A股上市公司名錄-A股上市公司大全-商業計劃書-可研報告-中商產業研究院數據庫-中商情報網
實現代碼
# 導入包
import pandas as pd
import time# 創建空列表
df_list = []# 循環讀取并拼接網頁表格
for i in range(5):df = pd.read_html(f'https://s.askci.com/stock/a/0-0?reportTime=2024-03-31&pageNum={i+1}#QueryCondition')# 將df拼接到列表中df_list.append(df[3])# 每次循環休息1秒鐘time.sleep(1)# 拼接所有表
all_df = pd.concat(df_list, ignore_index=True)
print(all_df)# 寫入 Excel
all_df.to_excel('./爽解決.xlsx')