Auto-Coder使用GPT-4o完成:在用TabPFN這個模型構建一個預測未來3天漲跌的分類任務

通過akshare庫,獲取股票數據,并生成TabPFN這個模型 可以識別、處理的格式,寫一個完整的預處理示例,并構建一個預測未來 3 天股價漲跌的分類任務

用TabPFN這個模型構建一個預測未來 3 天股價漲跌的分類任務,進行預測并輸出準確率

代碼

import os
import sys
import pandas as pd
import akshare as ak
# try:
#     import akshare as ak
# except ImportError:
#     print("請先運行: pip install akshare")
#     sys.exit(1)def fetch_stock_data(stock_code="000001", start_date="20150101", end_date=None):"""獲取股票歷史行情數據,兼容不同akshare接口"""print(f"DEBUG: akshare version: {ak.__version__}")print(f"DEBUG: fetch_stock_data params: symbol={stock_code}, start_date={start_date}, end_date={end_date}")try:# 優先嘗試 stock_zh_a_dailydf = ak.stock_zh_a_daily(symbol=stock_code, adjust="qfq")print("DEBUG: 使用 ak.stock_zh_a_daily 成功")print("DEBUG: Columns before rename:", df.columns.tolist())print("DEBUG: Head before rename:\n", df.head())# 若有 start_date/end_date,篩選if "date" in df.columns:df["date"] = pd.to_datetime(df["date"])if start_date:df = df[df["date"] >= pd.to_datetime(start_date)]if end_date:df = df[df["date"] <= pd.to_datetime(end_date)]df = df.sort_values("date").reset_index(drop=True)except Exception as e:print("ERROR: ak.stock_zh_a_daily() 調用異常,嘗試 fallback 原接口")print(f"Exception: {e}")try:df = ak.stock_zh_a_hist(symbol=stock_code, period="daily", start_date=start_date, end_date=end_date, adjust="qfq")print("DEBUG: 使用 ak.stock_zh_a_hist 成功")print("DEBUG: Columns before rename:", df.columns.tolist())print("DEBUG: Head before rename:\n", df.head())except Exception as e2:print("ERROR: Exception occurred while fetching stock data by both interfaces!")print(f"Exception: {e2}")return pd.DataFrame()if df.empty:print("ERROR: Fetched DataFrame is empty! Check stock code, date range, or network/API issues.")return df# 兼容列名rename_map = {"日期": "date","開盤": "open","收盤": "close","最高": "high","最低": "low","成交量": "volume","成交額": "amount","振幅": "amplitude","漲跌幅": "pct_chg","漲跌額": "chg","換手率": "turnover"}for k in list(rename_map.keys()):if k not in df.columns:rename_map.pop(k)df = df.rename(columns=rename_map)if "date" in df.columns:df["date"] = pd.to_datetime(df["date"])df = df.sort_values("date").reset_index(drop=True)# 自動補充pct_chg列(漲跌幅),百分比格式if "pct_chg" not in df.columns and "close" in df.columns:df["pct_chg"] = df["close"].pct_change() * 100return dfdef create_features_and_labels(df, n_past=5, n_future=3):"""構造特征和標簽,標簽為未來3日漲跌(1=漲,0=跌/平)"""feats = []labels = []for idx in range(n_past, len(df) - n_future):past_slice = df.iloc[idx-n_past:idx]# 特征: 過去n_past日的收盤價、漲跌幅、成交量feature = []feature += list(past_slice["close"].values)feature += list(past_slice["pct_chg"].values)feature += list(past_slice["volume"].values)# 未來n_future日的收盤價均值future_close_mean = df.iloc[idx:idx+n_future]["close"].mean()curr_close = df.iloc[idx-1]["close"]# 漲跌標簽: 未來3日均值 > 當前收盤價 => 1,否則0label = 1 if future_close_mean > curr_close else 0feats.append(feature)labels.append(label)feats_df = pd.DataFrame(feats, columns=[f"close_t-{i}" for i in range(n_past,0,-1)] + [f"pct_chg_t-{i}" for i in range(n_past,0,-1)] + [f"volume_t-{i}" for i in range(n_past,0,-1)])feats_df["label"] = labelsreturn feats_dfdef save_for_tabpfn(df, out_csv):"""保存為TabPFN模型可讀取的csv格式"""df.to_csv(out_csv, index=False)print(f"已保存至: {out_csv}")print(df.head())def main():# 拉取A股代碼表,打印前10條,輔助判斷symbol格式print("嘗試拉取A股代碼表,輔助symbol格式判斷...")try:code_df = ak.stock_info_a_code_name()print("A股代碼表前10條:")print(code_df.head(10))print("平安銀行相關行:")print(code_df[code_df["code"].str.contains("000001")])except Exception as e:print(f"拉取A股代碼表失敗: {e}")stock_code = "sz000001"  # 平安銀行start_date = "20150101"print("正在獲取股票數據...")df = fetch_stock_data(stock_code, start_date)print("正在生成特征與標簽...")processed = create_features_and_labels(df, n_past=5, n_future=3)# out_csv = os.path.join(os.path.dirname(__file__), f"{stock_code}_tabpfn.csv")out_csv =  f"{stock_code}_tabpfn.csv"print("正在保存為TabPFN格式...")save_for_tabpfn(processed, out_csv)print("預處理完成。")if __name__ == "__main__":main()

預測

import os
# 臨時繞過 /dev/null 權限問題
os.devnull = "/tmp/null"
if not os.path.exists("/tmp/null"):with open("/tmp/null", "w") as f:passimport sys
import numpy as np
import pandas as pd# 自動安裝tabpfn(如未安裝)
try:from tabpfn import TabPFNClassifier
except ImportError:import subprocesssubprocess.check_call([sys.executable, "-m", "pip", "install", "tabpfn"])from tabpfn import TabPFNClassifier# 讀取數據
# DATA_PATH = os.path.join(os.path.dirname(__file__), "sz000001_tabpfn.csv")
DATA_PATH = "sz000001_tabpfn.csv"
data = pd.read_csv(DATA_PATH, header=None)
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values# 按時間順序劃分(前80%訓練,后20%測試)
split_idx = int(0.8 * len(X))
X_train, X_test = X[:split_idx], X[split_idx:]
y_train, y_test = y[:split_idx], y[split_idx:]# TabPFN訓練與預測
# clf = TabPFNClassifier(device='cpu')
clf = TabPFNClassifier(device='cuda')
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
accuracy = np.mean(y_pred == y_test)print(f"Test Accuracy: {accuracy:.4f}")

最后生成的準確率:

Test Accuracy: 0.4812

這個準確率低于50%,反而可能證明程序是對的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84174.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84174.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84174.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Device Mapper 機制

Device Mapper 機制詳解 Device Mapper&#xff08;簡稱 DM&#xff09;是 Linux 內核中的一套通用塊設備映射框架&#xff0c;為 LVM、加密磁盤、RAID 等提供底層支持。本文將詳細介紹 Device Mapper 的原理、實現、內核配置、常用工具、操作測試流程&#xff0c;并配以詳細的…

crackme006

crackme006 名稱值軟件名稱aLoNg3x.1.exe加殼方式無保護方式Serial編譯語言Delphi調試環境Win10 64位使用工具x32dbg,ida pro,PEid,DarkDe4破解日期2025-06-05 脫殼 1. 先用PEid查殼 查到無殼 尋找Serial 查詢到編程語言為Delphi 導出Delphi符號表信息到x32dbg&#xff0c…

Conda 創建新環境時報錯 HTTP 502,如何解決?

Conda 創建新環境時報錯 HTTP 502&#xff0c;如何解決&#xff1f; 最近在用 Conda 創建新環境時&#xff0c;突然遇到這樣一個錯誤&#xff1a; CondaHTTPError: HTTP 502 BAD GATEWAY for url <https://mirrors.westlake.edu.cn/ANACONDA/cloud/conda-forge/linux-64/r…

2025最全TS手寫題之partial/Omit/Pick/Exclude/Readonly/Required

隨著 TS 在工作中使用的越來越廣泛&#xff0c;面試的時候面試官也都會加上一兩個 TS 的問題來了解候選人對于 TS 的熟悉程度&#xff0c;其中就有不少手寫題目&#xff0c;比如筆者在字節的一次二面&#xff0c;面試官就問到了我如何實現一個 Pick&#xff0c;在小紅書的一面&…

基于江科大stm32屏幕驅動,實現OLED多級菜單(動畫效果),結構體鏈表實現(獨創源碼)

引言 在嵌入式系統中&#xff0c;用戶界面的設計往往直接影響到用戶體驗。本文將以STM32微控制器和OLED顯示屏為例&#xff0c;介紹如何實現一個多級菜單系統。該系統支持用戶通過按鍵導航菜單&#xff0c;執行相應操作&#xff0c;并提供平滑的滾動動畫效果。 本文設計了一個…

LLMs之StructuredOutput:大模型結構化輸出的簡介、常用方案、前沿框架之詳細攻略

LLMs之StructuredOutput&#xff1a;大模型結構化輸出的簡介、常用方案、前沿框架之詳細攻略 目錄 大模型結構化輸出的簡介 1、特點與難點 大模型結構化輸出的常用方案及對比 1、前沿框架&#xff1a;vLLM 與 XGrammar 大模型結構化輸出的案例應用 大模型結構化輸出的簡介…

Linux中shell流程控制語句

一、if條件控制 1.1 語法解讀 單路決策 - 單分支if語句樣式&#xff1a;if [ 條件 ]then指令fi特點&#xff1a;單一條件&#xff0c;只有一個輸出 雙路決策 - 雙分支if語句樣式&#xff1a;if [ 條件 ]then指令1else指令2fi特點&#xff1a;單一條件&#xff0c;兩個輸出 …

Python學習(8) ----- Python的類與對象

Python 中的類&#xff08;Class&#xff09;與對象&#xff08;Object&#xff09;是面向對象編程&#xff08;OOP&#xff09;的核心。我們可以通過“類是模板&#xff0c;對象是實例”來理解它們的關系。 &#x1f9f1; 一句話理解&#xff1a; 類就像“圖紙”&#xff0c;對…

數據結構-文件

文件是性質相同的記錄的集合。 記錄是文件中存取的基本單位&#xff0c;數據項是文件可使用的最小單位。 操作系統研究的文件是一維的無結構連續字符序列&#xff0c;數據庫中研究的文件是帶有結構的記錄集合。 文件在外存上的4種基本組織方式&#xff1a;順序、索引、散列、鏈…

前端開發面試題總結-CSS篇

文章目錄 CSS面試高頻問答1、CSS選擇器的優先級2、CSS3新特性3、如何垂直水平居中盒子4、什么是重繪和重排5、px/em/rem/vw有什么區別6、rem布局的原理7、如何設置比12px還要小的字體8、CSS中隱藏元素的方式有哪些 CSS面試高頻問答 1、CSS選擇器的優先級 2、CSS3新特性 3、如何…

Python如何給視頻添加音頻和字幕

在Python中&#xff0c;給視頻添加音頻和字幕可以使用電影文件處理庫MoviePy和字幕處理庫Subtitles。下面將詳細介紹如何使用這些庫來實現視頻的音頻和字幕添加&#xff0c;包括必要的代碼示例和詳細解釋。 環境準備 在開始之前&#xff0c;需要安裝以下Python庫&#xff1a;…

解決ubuntu20.04無法喚醒的問題的一種方法

解決ubuntu20.04無法喚醒的問題的一種方法 我更改了三個個地方&#xff0c;目前不清楚是哪個地方起的作用&#xff0c;也可能都起作用了 修改的第一個地方 步驟 1: 獲取 Swap 分區的 UUID 首先&#xff0c;你需要知道你的 swap 分區的 UUID。你可以使用以下命令來查找它&am…

【大廠機試題解法筆記】矩陣匹配

題目 從一個 N * M&#xff08;N ≤ M&#xff09;的矩陣中選出 N 個數&#xff0c;任意兩個數字不能在同一行或同一列&#xff0c;求選出來的 N 個數中第 K 大的數字的最小值是多少。 輸入描述 輸入矩陣要求&#xff1a;1 ≤ K ≤ N ≤ M ≤ 150 輸入格式 N M K N*M矩陣 輸…

Kubernetes 網絡模型深度解析:Pod IP 與 Service 的負載均衡機制,Service到底是什么?

Pod IP 的本質與特性 Pod IP 的定位 純端點地址&#xff1a;Pod IP 是分配給 Pod 網絡命名空間的真實 IP 地址&#xff08;如 10.244.1.2&#xff09;無特殊名稱&#xff1a;在 Kubernetes 中&#xff0c;它通常被稱為 “Pod IP” 或 “容器 IP”生命周期&#xff1a;與 Pod …

使用osqp求解簡單二次規劃問題

文章目錄 一、問題描述二、數學推導1. 目標函數處理2. 約束條件處理 三、代碼編寫 一、問題描述 已知&#xff1a; m i n ( x 1 ? 1 ) 2 ( x 2 ? 2 ) 2 s . t . 0 ? x 1 ? 1.5 , 1 ? x 2 ? 2.5 min(x_1-1)^2(x_2-2)^2 \qquad s.t. \ \ 0 \leqslant x_1 \leqslant 1.5,…

pe文件結構(TLS)

TLS 什么是TLS? TLS是 Thread Local Storage 的縮寫&#xff0c;線程局部存儲。主要是為了解決多線程中變量同步的問題 如果需要要一個線程內部的各個函數調用都能訪問&#xff0c;但其它線程不能訪問的變量&#xff08;被稱為static memory local to a thread 線程局部靜態變…

Electron簡介(附電子書學習資料)

一、什么是Electron&#xff1f; Electron 是一個由 GitHub 開發的 開源框架&#xff0c;允許開發者使用 Web技術&#xff08;HTML、CSS、JavaScript&#xff09; 構建跨平臺的桌面應用程序&#xff08;Windows、macOS、Linux&#xff09;。它將 Chromium瀏覽器內核 和 Node.j…

如何使用DeepSeek幫助自己的工作?(Java開發)

如何使用DeepSeek幫助自己的工作&#xff1f; 作為Java開發者&#xff0c;你可以通過以下方式高效利用DeepSeek提升工作效率&#xff08;附具體操作示例&#xff09;&#xff1a; 一、日常編碼加速 1. 代碼生成與補全 // 輸入需求描述&#xff1a; "生成SpringBoot分頁…

Uniapp 二維碼生成與解析完整教程

前言 使用Uniapp開發多平臺應用&#xff0c;二維碼生成采用uQRCode插件&#xff0c;非常nice&#x1f601;&#xff01; Coding 原理 使用canvas繪制 生成二維碼數據 繪制到canvas上 使用 <uqrcoderef"uqrcodeRef"canvas-id"qrcode":value"qr…

Vue ⑤-自定義指令 || 插槽

自定義指令 自定義指令&#xff1a;自己定義的指令, 可以封裝一些 dom 操作&#xff0c; 擴展額外功能。 全局注冊 語法&#xff1a; Vue.directive(指令名, {"inserted" (el) {// 可以對 el 標簽&#xff0c;擴展額外功能el.focus()} })局部注冊 語法&#xff…