收盤價時空模式挖掘與多股走勢聚類分析:探索市場行為共性
- 一.版本信息
- 二.操作步驟
- 1.下載各股歷史交易數據
- A.代碼(download_stocks.py)
- B.執行
- 2.遍歷各股的csv文件,提取收盤價數據,歸一化,繪制曲線,保存圖片
- A.代碼
- B.執行
- 3.用上面的圖片集訓練VAE模型
- A.代碼
- B.執行
- 4.用上面訓出的VAE模型,提取圖片特征并聚類
- A.代碼
- B.執行
- 5.選擇出一類,分析這類股票是否有共性
- A.代碼
- B.執行
? 基于探究潛在關聯性的初衷,我們旨在探討是否存在某種顯著的共性驅動特定類別股票表現出趨同的市場走勢。本文系統地闡述了如何自深圳證券交易所、上海證券交易所、科創板以及北京證券交易所獲取各上市公司的歷史交易數據,并通過標準化處理各股票的收盤價序列,進而繪制其歸一化曲線并轉化為圖像形式予以保存。隨后,我們運用變分自編碼器(VAE)模型對選取的部分代表性圖像進行了深度學習建模,籍此提取每一張股票價格曲線圖像的內在特征向量。接下來,借助聚類分析手段,我們將所有股票的特征向量集合進行分類,從而揭示可能存在的結構化分布。最終,在形成的聚類中識別出走勢最為相似的一類股票群體,進而對其基本面及市場表現等特性進行詳盡分析,以期發現驅動此類股票同步波動的根本共性因素。
以上這段文字和標題采用通義千問潤色
持續更新中。
一.版本信息
屬性 | 值 |
---|---|
操作系統 | Windows 11 專業版 |
ChromeI瀏覽器 | 105.0.5195.102 |
chromedriver | 105.0.5195.52 |
股票成交數據下載:雪球 | https://xueqiu.com/ |
股票代碼下載:akshare | 1.12.76 |
selenium | 4.18.1 |
python | 3.9 |
二.操作步驟
1.下載各股歷史交易數據
主要步驟:
- 通過akshare下載所有的股票代碼
- 采用selenium登錄雪球網,手機掃碼登錄,確認登錄完成后,自動下載各股票的歷史交易數據,并存成csv文件
A.代碼(download_stocks.py)
import sys
import akshare as ak
from numpy import int64
import pandas as pd
import os
import codecs
import glob
import requests
import random
import time
import json
import datetime
import tqdm
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keysdef createWebDrv():chrome_options = webdriver.ChromeOptions() chrome_options.add_argument('ignore-certificate-errors')chrome_options.add_argument('--disable-gpu') chrome_options.add_argument('--start-maximized')chrome_options.add_argument('--incognito')chrome_options.add_argument("disable-cache"