Datawhale PyPOTS時間序列5月第1次筆記

課程原地址:

https://github.com/WenjieDu/PyPOTS(Package地址)

https://github.com/WenjieDu/BrewPOTS/tree/datawhale/202505_datawhale(Tutorial地址)?

2.1 PyPOTS簡介

PyPOTS 是一個專為處理部分觀測時間序列(Partially-Observed Time Series, 簡稱 POTS)而設計的開源 Python 工具箱。在現實世界中,由于傳感器故障、通信錯誤或其他不可預見的原因,時間序列數據中常常存在缺失值。這些缺失值會影響數據分析和建模的準確性。PyPOTS 的目標是為工程師和研究人員提供一個便捷的工具,使他們能夠專注于核心問題,而無需過多擔心數據中的缺失部分。工程師和研究人員可以通過PyPOTS輕松地處理POTS數據建模問題, 此外PyPOTS會持續不斷的更新關于部分觀測多變量時間序列的經典算法和先進算法. 除此之外, PyPOTS還提供了統一的應用程序接口,詳細的算法學習指南和應用示例。

2.2 PyPOTS 支持的核心任務

PyPOTS 針對帶有缺失值的多變量時間序列數據,提供了五大類核心任務支持,幾乎覆蓋了時間序列數據挖掘的各類典型應用場景。這些任務背后都配備了經過驗證的高質量算法,涵蓋傳統方法、深度學習模型以及概率圖模型等。

1. 🧩 缺失值填補(Imputation)

這是 PyPOTS 最重要的功能之一,主要目標是在數據中存在缺失的情況下,最大程度恢復原始信號。PyPOTS 實現了超過?12 種填補算法,既有傳統方法,也有現代深度學習模型:

  • 傳統方法

    • 前向填充(Forward Filling)
    • 后向填充(Backward Filling)
    • 線性插值(Linear Interpolation)
  • 深度學習方法

    • SAITS(Self-Attention based Imputation for Time Series):PyPOTS 自主實現的 Transformer 風格模型;
    • BRITS:基于雙向 RNN 的填補方法,兼顧因果一致性;
    • GRU-D:引入時間衰減機制,特別適合處理醫療場景;
    • MRNNCSDITransformer-Denoising Autoencoder?等
  • 概率模型

    • BTTF(Bayesian Temporal Tensor Factorization):使用貝葉斯推斷的張量分解方法,適合建模數據不確定性。

這些方法可根據數據特性靈活選擇,并通過統一接口進行調用和評估。

2. 🔮 預測(Forecasting)

PyPOTS 支持基于不完整觀測值的序列預測任務。在訓練時可以同時學習時間依賴性和缺失機制。支持的模型主要有:

  • Impute-then-Forecast?方法鏈:先填補再進行預測(支持組合 SAITS+LSTM 等);
  • 端到端預測模型:如 Transformer 與 GRU 基模型;
  • 與 Benchmark 模塊結合,支持將任何模型進行標準化評估。

目前框架內已集成了多種典型預測結構,并可與填補模塊無縫連接。

3. 🏷? 分類(Classification)

對于需要將時間序列分為不同類別的任務(如疾病分類、用戶行為識別等),PyPOTS 提供了適配部分觀測數據的時間序列分類器:

  • 基于 RNN、Transformer 的深度分類模型;
  • 可結合填補模塊預處理后的數據進行分類;
  • 支持多任務學習,將分類與預測或填補結合。

目前至少支持?5 種深度分類結構,同時提供高擴展性,便于接入外部分類器。

4. 🧭 聚類(Clustering)

聚類任務在探索性分析中非常重要,PyPOTS 提供了處理缺失值時間序列聚類的支持:

  • 填補 + 聚類:先使用 SAITS 等模型填補缺失,再進行 K-Means、DBSCAN 等聚類;
  • 特征提取 + 聚類:通過 Transformer 等模型提取潛在特征后進行聚類;
  • 支持對比學習風格的時間序列表示學習,用于后續聚類。

該模塊提供標準化聚類評估指標,如 Silhouette Score、NMI 等。

5. ?? 異常檢測(Anomaly Detection)

異常檢測主要用于識別時間序列中不符合正常模式的行為,PyPOTS 可處理帶缺失的異常檢測任務:

  • 填補 + Reconstruction-Based 方法:如使用自動編碼器重構序列,比較原始與預測誤差;
  • 基于統計的方法:結合滑動窗口與動態閾值;
  • Transformer-based 模型:學習時間依賴與異常模式,例如結合 CSDI 等模型進行異常點估計;
  • 可與 BenchPOTS 一起評估各類異常檢測算法的性能。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/79687.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/79687.shtml
英文地址,請注明出處:http://en.pswp.cn/web/79687.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

網安學途—流量分析 attack.pcap

attack.pacp 使用Wireshark查看并分析虛擬機windows 7桌面下的attack.pcapng數據包文件,通過分析數據包attack.pcapng找出黑客的IP地址,并將黑客的IP地址作為FLAG (形式:[IP地址])提交: 過濾器篩選&#x…

【大模型】DeepResearcher:通用智能體通過強化學習探索優化

DeepResearcher:通過強化學習在真實環境中擴展深度研究 一、引言二、技術原理(一)強化學習與深度研究代理(二)認知行為的出現(三)模型架構 三、實戰運行方式(一)環境搭建…

go語言實現IP歸屬地查詢

效果: 實現代碼main.go package mainimport ("encoding/json""fmt""io/ioutil""net/http""os" )type AreaData struct {Continent string json:"continent"Country string json:"country"ZipCode …

基于STM32、HAL庫的SGTL5000XNLA3R2音頻接口芯片驅動程序設計

一、簡介: SGTL5000XNLA3R2 是 Cirrus Logic 推出的高性能、低功耗音頻編解碼器,專為便攜式和電池供電設備設計。它集成了立體聲 ADC、DAC、麥克風前置放大器、耳機放大器和數字信號處理功能,支持 I2S/PCM 音頻接口和 I2C 控制接口,非常適合與 STM32 微控制器配合使用。 二…

window 顯示驅動開發-報告圖形內存(一)

計算圖形內存 在 VidMm 能夠向客戶端報告準確的帳戶之前,它必須首先計算圖形內存的總量。 VidMm 使用以下內存類型和公式來計算圖形內存: 系統總內存 此值是操作系統可訪問的系統內存總量。 BIOS 分配的內存不會出現在此數字中。 例如,一臺…

[FA1C4] 博客鏈接

Blog Link 博客已經從 CSDN 轉移 高情商:博客是給人看的 低情商:CSDN 已經爛了根本不能看 鏈接: https://fa1c4.github.io/

python通過curl訪問deepseek的API調用案例

廢話少說,開干! API申請和充值 下面是deepeek的API網站 https://platform.deepseek.com/ 進去先注冊,是不是手機賬號密碼都不重要,都一樣,完事充值打米,主要是打米后左側API Keys里面創建一個API Keys&am…

【計算機視覺】OpenCV項目實戰:基于face_recognition庫的實時人臉識別系統深度解析

基于face_recognition庫的實時人臉識別系統深度解析 1. 項目概述2. 技術原理與算法設計2.1 人臉檢測模塊2.2 特征編碼2.3 相似度計算 3. 實戰部署指南3.1 環境配置3.2 數據準備3.3 實時識別流程 4. 常見問題與解決方案4.1 dlib安裝失敗4.2 人臉檢測性能差4.3 誤識別率高 5. 關鍵…

第6章: SEO與交互指標

第6章: SEO與交互指標 在當今的SEO環境中,Google越來越重視用戶交互指標,如頁面停留時長、交互性能等。本章將深入探討如何優化網頁速度和用戶交互體驗,以提升SEO效果和用戶滿意度。 1. Google的新時代SEO指標 隨著互聯網技術的發展&#xff…

Starrocks的主鍵表涉及到的MOR Delete+Insert更新策略

背景 寫這個文章的作用主要是做一些總結和梳理,特別是正對大數據場景下的實時寫入更新策略 COW 和 MOR 以及 DeleteInsert 的技術策略的演進, 這也適用于其他大數據的計算存儲系統。該文章主要參考了Primary Key table. 分析總結 Starrocks 的主鍵表主…

C 語言_常見排序算法全解析

排序算法是計算機科學中的基礎內容,本文將介紹 C 語言中幾種常見的排序算法,包括實現代碼、時間復雜度分析、適用場景和詳細解析。 一、冒泡排序(Bubble Sort) 基本思想:重復遍歷數組,比較相鄰元素,將較大元素交換到右側。 代碼實現: void bubbleSort(int arr[], i…

JIT+Opcache如何配置才能達到性能最優

首先打開php.ini文件,進行配置 1、OPcache配置 ; 啟用OPcache opcache.enable1; CLI環境下啟用OPcache(按需配置) opcache.enable_cli0; 預加載腳本(PHP 7.4,加速常用類) ; opcache.preload/path/to/prel…

Python訓練打卡Day23

機器學習管道 pipeline 基礎概念 pipeline在機器學習領域可以翻譯為“管道”,也可以翻譯為“流水線”,是機器學習中一個重要的概念。 在機器學習中,通常會按照一定的順序對數據進行預處理、特征提取、模型訓練和模型評估等步驟,以…

GPU SIMT架構的極限壓榨:PTX匯編指令級并行優化實踐

點擊 “AladdinEdu,同學們用得起的【H卡】算力平臺”,H卡級別算力,按量計費,靈活彈性,頂級配置,學生專屬優惠。 一、SIMT架構的調度哲學與寄存器平衡藝術 1.1 Warp Scheduler的調度策略解構 在NVIDIA GPU…

HarmonyOS 【詩韻悠然】AI古詩詞賞析APP開發實戰從零到一系列(二、項目準備與后臺服務搭建)

在開發一款面向HarmonyOS平臺的應用程序——【詩韻悠然】AI古詩詞賞析APP時,選擇了流行Go語言作為后端開發語言,并使用了go-zero微服務框架來搭建服務接口。本文將詳細介紹項目準備和后臺服務搭建的過程,幫助大家更好地理解和掌握go-zero框架…

QT5.14安裝以及新建基礎項目

進入qt中文網站:Qt | 軟件開發全周期的各階段工具 額,考慮新手可能還是找不到,我就分享一下我下載的的吧 通過網盤分享的文件:qt-opensource-windows-x86-5.14.2.exe 鏈接:https://pan.baidu.com/s/1yQTRp-b_ISje5B3UWb7Apw?pw…

深入解析 I/O 模型:原理、區別與 Java 實踐

一、I/O 模型的核心概念 I/O 操作的本質是數據在用戶空間(應用程序內存)和內核空間(操作系統內核內存)之間的傳輸。根據數據準備與拷貝階段的處理方式不同,I/O 模型可分為以下五類: 阻塞 I/O(…

EMQX v5.0通過連接器和規則同步數據

1 概述 EMQX數據集成功能,幫助用戶將所有的業務數據無需額外編寫代碼即可快速完成處理與分發。 數據集成能力由連接器和規則兩部分組成,用戶可以使用數據橋接或 MQTT 主題來接入數據,使用規則處理數據后,再通過數據橋接將數據發…

重構門店網絡:從“打補丁“到“造地基“的跨越

您是否遇到過這樣的窘境? 新店開張要等一周,就為裝根網線; 偏遠地區門店三天兩頭斷網,顧客排長隊卻結不了賬; 總部想看實時數據,結果收到一堆亂碼報錯; 總部ERP系統升級,2000家門…

PH熱榜 | 2025-05-13

1. FirstQuadrant 標語:通過以人為本的人工智能來最大化B2B銷售 介紹:銷售人工智能,幫助創始人和收益團隊提高效率,保持組織有序,并促成更多交易。它通過簡化銷售幕后工作,確保每個細節都不會遺漏。 產品…