1、數據挖掘定義
把數據庫中大量數據背后隱藏的重要信息抽取出來,然后為公司創造很多潛在的利潤,針對這種海量數據庫中挖掘數據信息的技術稱為數據挖掘(DM)。
2、數據挖掘的分類
按照數據庫種類:關系型數據庫的數據挖掘、數據倉庫的數據挖掘、面向對象數據庫的挖掘、空間數據庫的挖掘、正文數據庫和多媒體數據庫的數據挖掘。
按知識類別來分:關聯、特征描述、分類分析、聚類分析、趨勢、偏差分析。
按知識抽象層次:一般文化知識、初級知識、多層次知識。
3、數據挖掘常用技術
人工神經網絡:仿照生理神經網絡結構的非線性預測模型,通過學習模式識別。
決策樹:代表決策集的樹形結構。
遺傳算法:基于進化理論,并采用遺傳結合、遺傳變異、以及自然選擇等設計方法的優化技術。
緊鄰算法:將數據集合中每一個記錄進行分類的方法。
規則推導:從統計意義上對數據進行規則尋找和推導。
4、數據挖掘和數據倉庫的關系
數據挖掘的關鍵在于通過訪問正確、完整、集成的數據,才能進行深層次的分析,尋求有益的信息。數據倉庫是提供數據的源頭,并且數據倉庫的聯機分析功能OLAP還為數據挖掘提供了一個極佳的操作平臺。如果兩者結合起來可以實現數據的有效聯結,可以給數據挖掘帶來便利和功能。
5、數據挖掘技術的應用過程
確定挖掘對象:要清晰定義挖掘對象、認清數據挖掘的目標。
準備數據:根據確定的挖掘對象,然后搜索所有與業務對象有關的內部和外部數據,然后選擇適合數據挖掘應用的數據。需要對數據進行預處理比如數據清洗、解決冗余、缺值、不一致、數據分組等問題。
建立模型:將數據轉換為一個分析模型,主要是針對挖掘算法建立。
數據挖掘:針對轉化的數據進行數據挖掘,一般都是數據挖掘工具自動完成。
結果分析:針對數據挖掘的結果進行解釋和評估。一般根據數據挖掘操作結果制定決策成敗來定。
數據應用:數據挖掘的結果結果業務決策人員的認可,然后就可以實際利用了。
?
IT技術分享社區
個人博客網站:https://programmerblog.xyz
文章推薦程序員效率:畫流程圖常用的工具程序員效率:整理常用的在線筆記軟件遠程辦公:常用的遠程協助軟件,你都知道嗎?51單片機程序下載、ISP及串口基礎知識硬件:斷路器、接觸器、繼電器基礎知識
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?