數據挖掘--挖掘頻繁模式、關聯和相關性:基本概念和方法

頻繁項集、閉項集和關聯規則

頻繁項集:出現的次數超過最小支持度計數閾值

閉頻繁項集:一個集合他的超集(包含這個集合的集合)在數據庫里面的數量和這個集合在這個數據庫里面的數量不一樣,這個集合就是閉項集

如果這個集合還是頻繁的,那么他就是極大頻繁項集

項集{a,b}出現在TID為1,2的事務中,其支持度計數為2。而它的直接超集{a,b,c}支持度計數也為2,所以{a,b}不是閉項集。

Apriori算法

手撕例題

STEP1.候選1項集→頻繁1象集

拿到候選數據后,我們先篩選出候選頻繁1象集,并算出它們的支持度【支持度=有購買該物品的人/總人數】,完成這一操作后,將它和題目中給出的最小支持度作比較,從而得到頻繁1象集!

STEP2-3.重復上述步驟,進行候選2項集→頻繁2象集;候選3項集→頻繁3象集的過程直到不能夠再往下為止(例如,本題到頻繁3象集,{面、奶、酒}為止)。

STEP4.寫出最終頻繁N象集的非空真子集,如題中{面、奶、酒}的非空真子集如下所示,并分別計算它們的置信度!(注意!這里不再是計算支持度了哈!別和上面搞混了!)

舉個例子,我們要求{面}→{奶、酒}的置信度,翻譯一下即,我們想知道買了面的人,有多大可能性也買了奶、酒,即同時買面、奶、酒的人數/買面的人數=2/3!

后續同理,我們可以得到所有關系的置信度,最后我們再拿題干中的最小置信度和算出來的置信度進行比較!就能得出最終的強關聯規則(同時滿足最小支持度、置信度)

fp樹

先建立頻繁1項集

遞減排序

通過一行行事務進行建立樹(如果有相同路徑數字加1,沒有創建新的子樹)

挖掘出頻繁項集

關聯規則

同時滿足支持度以及置信度

強規則不一定是有趣的

強規則有一定欺騙性(置信度存在問題)可能某商品是必須品

從關聯分析到相關分析

提升度

lift(A,B)=P(AnB)/P(A)*P(B)

>1正相關,一個出現另一個就出現

<1負相關,一個出現另一個就不出現

=1獨立

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/24239.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/24239.shtml
英文地址,請注明出處:http://en.pswp.cn/web/24239.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

關于json文件的保存

在nodejs中&#xff0c;通常用fs.writeFileSync(filepath,JSON.stringify(jsonvar))這樣的調用&#xff0c;將json或者json數組轉換成字符串寫入到文件中&#xff0c;這時json的數據是緊湊的&#xff0c;沒有空格、制表符和換行來分隔&#xff0c;優點是可以省存儲空間&#xf…

SpringCache和SpringTask

SpringCache 在啟動類上加EnableCaching注解 我們只要在Controller上寫一個SpringCache相應的注解 我們就能實現緩存了 簡化緩存操作代碼&#xff0c;提高我們的效率 我們默認是我們的spring做緩存 但我們還可以替換我們的緩存技術 例如 EhCache Google Redis 來作為…

MAVEN:自定義模板Archetype的創建

目錄 一、簡介 二、具體步驟 三、 vscode通過模板創建項目 四、通過IDEA創建 一、簡介 有時候MAVEN自帶的模板庫并不能滿足我們創建項目的需求&#xff0c;為了能夠快速創建項目&#xff0c;免去每次復雜的配置&#xff0c;所以我們需要自定義模板庫&#xff0c;本次操作基于…

Linux 性能優化基礎

文章目錄 常見指標分類&#xff08;USE法&#xff09;常見性能工具CPU性能工具內存性能工具文件系統和磁盤I/O性能工具網絡性能工具 根據指標找工具CPU性能內存性能文件系統和磁盤I/O網絡性能 根據工具找指標CPU性能內存性能文件系統和磁盤I/O網絡性能 CPU性能分析一般步驟內存…

【C++題解】1254. 求車速

問題&#xff1a;1254. 求車速 類型&#xff1a;簡單循環 題目描述&#xff1a; 一輛以固定速度行駛的汽車&#xff0c;司機在上午 10 點看到里程表上的讀數是一個對稱數(即這個數從左向右讀和從右向左讀是完全一樣的)&#xff0c;為95859 。 兩小時后里程表上 出現了一個新的…

不明確的unicode字符

不明確的unicode字符 起因&#xff1a;一個Demo源碼&#xff0c;也不知道是用什么編輯器編的&#xff0c;中文注釋非常全面。就打算原來的基礎上改改就用&#xff0c;特別是里面大量接口、類的定義&#xff0c;真沒必要重寫。但是在VS Code里面打開&#xff0c;出現“本文檔包含…

k-means聚類模型的優缺點

一、k-means聚類模型的優點 1. 簡單高效&#xff1a;k-means算法思想簡單直觀&#xff0c;易于實現。它通過迭代計算樣本點與聚類中心之間的距離&#xff0c;并不斷調整聚類中心的位置&#xff0c;直至滿足終止條件。由于其計算過程相對直接&#xff0c;所以具有較高的執行效率…

控制臺輸入javac命令輸出的結果中的中文亂碼解決方式

默認字符編碼UTF-8無法解析中文。設置環境變量中 “JAVA_TOOL_OPTIONS” 的值為"UTF-8" 即可。 具體配置步驟&#xff1a; 桌面右鍵"我的電腦" --> 屬性 高級系統設置 環境變量 用戶變量中添加 JAVA_TOOL_OPTIONS 然后確定&#xff0c;保存即可。

阿里云一鍵登錄號碼認證服務

阿里云文檔&#xff1a;號碼認證SDK_號碼認證服務(PNVS)-阿里云幫助中心 對于后端大概流程 前端App會傳一個token過來 后端通過下面方法解析 如果解析可以獲得號碼,說明號碼認證成功,如果無法正確解析則認證失敗 /*** actoken來換取電話號碼* param token app端用戶授權actok…

WDF驅動開發-PNP和電源管理(二)

下面是一種比較典型的 PnP 和電源管理方案&#xff0c;WDF框架在這些情況下調用驅動程序的事件回調函數&#xff1a; 用戶插入設備用戶拔出設備設備進入低功耗狀態設備回到工作狀態PnP 管理器重新分發系統資源 這些幾乎是所有的和PNP、電源管理相關的場景了&#xff0c;它們分…

達夢8 網絡中斷對系統的影響

測試環境&#xff1a;三節點實時主從 版本&#xff1a;--03134283938-20221019-172201-20018 測試1 系統沒有啟動確認監視器 關閉節點3網卡 登錄節點1檢查主庫狀態 顯示向節點2發送歸檔成功&#xff0c;但無法收到節點3的消息&#xff0c;節點1掛起 日志報錯如下&#xf…

易于上手的requests

Python中的requests庫主要用于發送HTTP請求并獲取響應結果。在現代網絡編程中&#xff0c;HTTP請求是構建客戶端與服務器之間通信的基礎。Python作為一種高級編程語言&#xff0c;其豐富的庫支持使得它在網絡數據處理領域尤為突出。其中&#xff0c;requests庫以其簡潔、易用的…

力扣560. 和為 K 的子數組

Problem: 560. 和為 K 的子數組 文章目錄 題目描述思路復雜度Code 題目描述 思路 1.初始化一個哈希表preSum&#xff0c;用于記錄前綴和及其出現次數,ans記錄和為k的子數組數量、sum_i記錄當前前綴和&#xff1b; 2.將前綴和為 0 的情況存入哈希表&#xff0c;表示前綴和為 0 出…

【Python】認識 Python

一、計算機基礎概念 1、什么是計算機 很多老一輩的人&#xff0c;管下面這個叫做計算機。然而&#xff0c;它只是 “計算器”&#xff0c;和計算機是有很大區別的。 現在我們所說的計算機&#xff0c;不光能進行算術運算&#xff0c;還能進行邏輯判斷、數據存儲、網絡通信等…

遇到no module named ‘pyLDAvis.sklearn‘的解決辦法

在NLP學習中&#xff0c;常常用到LDA主題模型對文本進行分類&#xff0c;可視化經常用到的代碼有 import pyLDAvis import pyLDAvis.sklearnpanel pyLDAvis.sklearn.prepare(lda, tf_idf, tf_idf_vectorizer) pyLDAvis.save_html(panel, lda_visualization.html) pyLDAvis.di…

HTML靜態網頁成品作業(HTML+CSS)—— 節日母親節介紹網頁(5個頁面)

&#x1f389;不定期分享源碼&#xff0c;關注不丟失哦 文章目錄 一、作品介紹二、作品演示三、代碼目錄四、網站代碼HTML部分代碼 五、源碼獲取 一、作品介紹 &#x1f3f7;?本套采用HTMLCSS&#xff0c;未使用Javacsript代碼&#xff0c;共有5個頁面。 二、作品演示 三、代…

騎砍2霸主MOD開發(12)-游戲實例GameEntity

一.GameEntity游戲實例 <1.通用GameEntity,梯子,椅子,攻城云梯,戰車等定義為GameEntity,一個GameEntity由若干GameEntityComponets組成,例如攻城云梯的輪子是一個獨立Component,支架是一個獨立Component, GameEntity GameEntityComponent1 GameEntityComponent2 GameEntit…

前端開發之WebSocket通信

WebSocket WebSocket是一種在單個TCP連接上進行全雙工通信&#xff08;雙向同時通信&#xff09;的協議&#xff0c;它允許服務器和客戶端之間自由地交換數據&#xff0c;無需反復建立連接。其特點包括&#xff1a; 雙向通信&#xff1a;實時性強&#xff0c;支持服務器向客戶…

移動端前端開發遇到過的Andorid和IOS的差異記錄

移動端前端開發遇到過的安卓和蘋果的差異記錄 1. 引入外部資源&#xff0c;最好用https2. IOS時間戳獲取NaN問題3. 金額三位分節顯示方式4. .webp圖片支持問題 1. 引入外部資源&#xff0c;最好用https ios處于安全性的考慮&#xff0c;不大支持http引入外部資源&#xff0c;所…

【kubernetes】探索k8s集群的配置資源(secret和configma)

目錄 一、Secret 1.1Secret 有四種類型 1.2Pod 有 3 種方式來使用 secret 1.3應用場景&#xff1a;憑據 1.4創建 Secret 1.4.1用kubectl create secret命令創建Secret 1.4.2內容用 base64 編碼&#xff0c;創建Secret 1.4.2.1Base64編碼 1.4.2.2創建YAML文件 1.4.2.3…