數據倉庫實驗四:聚類分析實驗

目錄

    • 一、實驗目的
    • 二、實驗內容和要求
    • 三、實驗步驟
      • 1、建立數據表
      • 2、建立數據源視圖
      • 3、建立挖掘結構Student.dmm
      • 4、部署項目并瀏覽結果
      • 5、挖掘模型預測
    • 四、實驗結果分析
    • 五、實驗總結體會


一、實驗目的

??通過本實驗,進一步理解基于劃分的、基于層次的、基于密度的聚類分析方法以及經典的聚類分析算法,并掌握利用 SQL Server 等工具平臺進行聚類分析的方法,掌握挖掘結構、挖掘模型的基本概念,能夠使用數據挖掘向導創建數據挖掘結構和模型,掌握數據挖掘設計器的使用方法,掌握模型查看器方法 ,理解聚類分析算法常用的參數含義和設置方法。

二、實驗內容和要求

??針對實際需求,構建格式規范的數據集,并能夠借助于 SQL Server、Weka、SPSS 等工具平臺,利用 K-means 等聚類分析算法進行聚類分析,正確分析實驗結果,發現知識,完成實驗報告。

三、實驗步驟

??以下是參照示例:以 SQL Server 作為工具,完成數據集的構建和聚類分析。——以下內容,僅供參考!

1、建立數據表

啟動SQL Server,在DM數據庫中建立一個Student表,其結構如下,并輸入示例數據。

在這里插入圖片描述
在這里插入圖片描述

2、建立數據源視圖

新建一個 Analysis Services 項目 ClusterMining。建立數據源視圖,它對應DM數據庫中的Student表。

在這里插入圖片描述
在這里插入圖片描述

3、建立挖掘結構Student.dmm

新建挖掘結構,在“創建數據挖掘結構”頁面的“您要使用何種數據挖掘技術?”選項下,選中列表中的“Microsoft聚類分析”。

在這里插入圖片描述
選擇數據源視圖為DM。

在“指定表類型”頁面上,在Student表的對應行中選中“事例”復選框,并單擊下一步按鈕。

在這里插入圖片描述
在“指定定型數據”頁面中,將“學號”列設為鍵列,把其它所有列設為輸入列。

在這里插入圖片描述
在這里插入圖片描述
在“創建測試集”頁面上,“測試數據百分比”選項的默認值為30%,將該選項更改為0.

在這里插入圖片描述
在完成向導頁面的“挖掘結構名稱”和“挖掘模型名稱”中,都輸入Student。

在這里插入圖片描述
在“挖掘模型”選項卡中設置算法的參數如下圖所示。

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

4、部署項目并瀏覽結果

先處理(部署)、再瀏覽。

在這里插入圖片描述
在挖掘模型查看器中,瀏覽聚類分析的結果。

在這里插入圖片描述

5、挖掘模型預測

(1)單擊“挖掘模型預測”選項卡,再單擊“選擇輸入表”對話框中的“選擇事例表”命令,指定DM數據源視圖中的Student表。

在這里插入圖片描述
(2)保持默認的字段連接關系,將Student表中的各個列拖放到下方的列表中,選中最后一行下面的空白行字段前面的“源”,從下拉列表中選擇“預測函數”選項,并設置字段為Cluster。

在這里插入圖片描述
(3)在任一空白處右擊,并在下拉菜單中選擇“結果”,出現如下所示的分類結果。

在這里插入圖片描述

四、實驗結果分析

1、分類關系圖

(1)所有鏈接

在這里插入圖片描述
(2)最強鏈接

在這里插入圖片描述
2、分類剖面圖

在這里插入圖片描述
3、分類特征

在這里插入圖片描述
4、分類對比
(1)“分類1”VS“非分類1”

在這里插入圖片描述
(2)“分類1”VS“分類2”

在這里插入圖片描述

五、實驗總結體會

??通過數據挖掘聚類分析實驗,積累了許多寶貴的經驗。首先,我認識到對數據進行深入理解是取得成功的關鍵。在開始實驗之前,我仔細分析了數據的結構、特征和可能存在的異常或缺失值等情況。這樣的數據理解使我能夠更好地選擇合適的分析方法,并取得更好的結果。其次,在進行聚類分析之前,特征選擇和預處理是不可或缺的步驟。通過特征選擇,我能夠提高模型的性能并降低計算復雜性。而預處理則可以使數據更加干凈、一致,從而減少對聚類結果的影響。
??選擇合適的算法是成功實現聚類分析的重要因素。我研究了各種聚類算法,包括K均值、層次聚類和DBSCAN等。每種算法都有其適用的場景和限制,所以我根據實際情況選擇了最合適的算法。這樣做可以確保我的聚類結果更加準確和可靠。然后,我意識到結果的解釋和評估是聚類分析中不可或缺的步驟。聚類分析的結果不僅僅是一組類別標簽,更重要的是對這些類別的解釋和理解。最后,我意識到持續學習和改進是取得優秀成績的關鍵。數據倉庫與數據挖掘是一個不斷發展和變化的領域,需要不斷學習新的方法和算法。通過不斷嘗試新的技術和流程,我能夠不斷優化實驗流程,并取得更好的結果。
??總的來說,進行數據倉庫與數據挖掘的聚類分析實驗是一個充滿挑戰但又充滿樂趣的過程。通過深入理解數據、選擇合適的算法、進行特征選擇和預處理、解釋和評估結果,以及持續學習和改進,我相信我能夠不斷提高我的數據分析技能,并在這個領域取得更出色的成果。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/13550.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/13550.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/13550.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Easy-poi 和 EasyExcel 選型

目錄 共同點地址如何選 共同點 easy-poi 和 easyexcel 都是基于 apache poi 進行二次開發的,底層都是依賴的 apache poi使用簡單,都可以通過簡單的注解實現excel文件的導入導出 地址 esay poi 是一個開源的 excel,word 處理框架。鏈接 easy excel 是…

Xed編輯器開發第二期:使用Rust從0到1寫一個文本編輯器

第三篇 這部分接著處理用戶退出命令以及一些其他新功能; 3.1 使用CtrlQ退出 modifiers: event::KeyModifiers::CONTROL,使用CONTROL替換之前的NONE值即可; 3.2 重構鍵盤輸入 讓我們重構我們的代碼,以便我們有一個用于低級按鍵讀取的函數&…

《Rust奇幻之旅:從Java和C++開啟》第1章Hello world 2/5

講動人的故事,寫懂人的代碼 很多程序員都在自學Rust。 ??但Rust的學習曲線是真的陡,讓人有點兒怵頭。 程序員工作壓力大,能用來自學新東西的時間簡直就是鳳毛麟角。 ??目前,在豆瓣上有7本Rust入門同類書。它們雖有高分評價,但仍存在不足。 首先,就是它們介紹的Rust新…

【前端面經】BFC

BFC BFC什么是 BFC?元素開啟 BDC 后的特殊布局效果元素開啟 BFC 的方式 BFC 什么是 BFC? 官方解釋:A block formatting context (BFC) is a part of a visual CSS rendering of a web page. It’s the region in which the layout of block…

什么是谷歌爬蟲?

其實就是谷歌用來瀏覽網絡信息的一個自動化程序,他們會在你的網站爬取,尋找和搜集信息,谷歌爬蟲可以說決定著一個網站在谷歌的生死 谷歌爬蟲的作用機制就在于發現新網站以及新網頁,然后他會把網頁的內容帶回去,更新到…

PikaUnsafe upfileupload

1.client check 客戶端檢測,前端js檢測,禁用js和修改后綴名即可。 php格式不能上傳,我們修改后綴上傳。 蟻劍成功連接。 2.MIME type 這個就是 content-type 規定上傳類型,上面的方法也能成功,也可以修改 conten-ty…

面試框架【面試準備】

前言 2023-9-12 12:12:04 2023-09-14 16:13:04 公開發布于 2024-5-22 00:16:21 以下內容源自《【面試準備】》 僅供學習交流使用 版權 禁止其他平臺發布時刪除以下此話 本文首次發布于CSDN平臺 作者是CSDN日星月云 博客主頁是https://blog.csdn.net/qq_51625007 禁止其他平…

奇偶數遞增遞減-第13屆藍橋杯選拔賽Python真題精選

[導讀]:超平老師的Scratch藍橋杯真題解讀系列在推出之后,受到了廣大老師和家長的好評,非常感謝各位的認可和厚愛。作為回饋,超平老師計劃推出《Python藍橋杯真題解析100講》,這是解讀系列的第70講。 奇偶數遞增遞減&a…

vite+ts+mock+vue-router+pinia實現vue的路由權限

0.權限管理 前端的權限管理主要分為如下: 接口權限路由權限菜單權限按鈕權限 權限是對特定資源的訪問許可,所謂權限控制,也就是確保用戶只能訪問到被分配的資源 1.項目搭建 創建vite項目 yarn create vite配置別名 npm install path -…

4. C++入門:內聯函數、auto關鍵字、范圍for及nullptr

內聯函數 概念 以inline修飾的函數叫做內聯函數,編譯時C編譯器會在調用內聯函數的地方展開,沒有函數調用建立棧幀的開銷,內聯函數提升程序運行的效率 對比C的宏 C語言不足:宏 #define ADD(x, y) ((x)(y))int main() {int ret…

python實現520表白圖案

今天是520哦,作為程序員有必要通過自己的專業知識來向你的愛人表達下你的愛意。那么python中怎么實現繪制520表白圖案呢?這里給出方法: 1、使用圖形庫(如turtle) 使用turtle模塊,你可以繪制各種形狀和圖案…

Docker 安裝kingbase V8r6

下載 官網下載,注意:這里下載 Docker 版本v8r6 安裝 # 導入鏡像 docker load -i kingbase.tar# 重命名 docker tag [image-name]:[tag] [new-image-name]:[new-tag]# 刪除 docker rmi [image-name]:[tag]# 創建容器 docker run -tid \ --privileged \…

python實現繪制煙花代碼

在Python中,我們可以使用多個庫來繪制煙花效果,例如turtle庫用于簡單的繪圖,或者更復雜的庫如pygame或matplotlib結合動畫。但是,由于turtle庫是Python自帶的,我們可以使用它來繪制一個簡單的煙花效果。 下面是一個使…

Stable Diffusion AMD加速方法-ZLUDA重出江湖

目前幾大開源的Stable Diffusion平臺,更新速度都慢了,一個是沒有太多新技術出現,新出的基礎模型也都不完整開源了(API調用),能整的功能,也都整得差不多了。然后一群AMD死忠還在等著有一個能有一…

【前端】使用 Canvas 實現貪吃蛇小游戲

使用 Canvas 實現貪吃蛇小游戲 在這篇博客中,我們將介紹如何使用 HTML5 Canvas 和 JavaScript 實現一個簡單的貪吃蛇(Snake)小游戲。這個項目是一個基礎的游戲開發練習,它可以幫助你理解如何在 Canvas 上繪圖、如何處理用戶輸入以…

Laravel(Lumen8) + Supervisor 實現多進程redis消息隊列

相關文章:Supervisor守護進程工具安裝與使用 1、通用消息隊列 /App/Job/CommonJob.php: <?phpnamespace App\Jobs; use Illuminate\Support\Facades\Log; use Illuminate\Support\Str;class CommonJob extends Job {public $timeout; //超時時間protected $data; //隊列…

Android:OkHttp網絡請求框架的使用

目錄 一&#xff0c;OkHttp簡介 二&#xff0c;OkHttp請求處理流程 三&#xff0c;OkHttp環境配置 四&#xff0c;OkHttp的使用 1.get網絡請求 2.post上傳表單數據 3.post上傳json格式數據 4.文件上傳 5.文件下載 一&#xff0c;OkHttp簡介 OkHttp是square公司推出的一…

npm 源管理工具 nrm

npm 源管理工具 nrm 安裝(可能很慢, 多試幾次) npm install -g nrm查看可選擇源列表 nrm ls切換源 nrm use <registry>如: nrm use taobao

rust的版本問題,安裝問題,下載問題

rust的版本、安裝、下載問題 rust版本問題&#xff0c; 在使用rust的時候&#xff0c;應用rust的包&#xff0c;有時候包的使用和rust版本有關系。 error: failed to run custom build command for pear_codegen v0.1.2 Caused by: process didnt exit successfully: D:\rus…

鴻蒙全面開發指南:入門、生態安全與資源支持

鴻蒙全面開發指南&#xff1a;入門、生態安全與資源支持 本文全面梳理了鴻蒙操作系統的開發入門流程&#xff0c;涵蓋了開發環境準備、工具使用、項目創建、模擬器配置到應用安全設計的各個方面。通過本文&#xff0c;讀者不僅能夠了解鴻蒙開發的基本步驟&#xff0c;也能深入理…