常用的機器學習數據挖掘知識點【轉】

轉自:

【基礎】常用的機器學習&數據挖掘知識點

Basis(基礎):

MSE(Mean Square Error 均方誤差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最大似然估計),QP(Quadratic Programming 二次規劃), CP(Conditional Probability條件概率),JP(Joint Probability 聯合概率),MP(Marginal Probability邊緣概率),Bayesian Formula(貝葉斯公式),L1 /L2Regularization(L1/L2正則,以及更多的,現在比較火的L2.5正則等),GD(GradientDescent 梯度下降),SGD(Stochastic Gradient Descent 隨機梯度下降),Eigenvalue(特征值),Eigenvector(特征向量),QR-decomposition(QR分解),Quantile (分位數),Covariance(協方差矩陣)。

Common Distribution(常見分布):

Discrete Distribution(離散型分布):BernoulliDistribution/Binomial(貝努利分布/二項分布),Negative BinomialDistribution(負二項分布),MultinomialDistribution(多項式分布),Geometric Distribution(幾何分布),HypergeometricDistribution(超幾何分布),Poisson Distribution (泊松分布)

Continuous Distribution (連續型分布):UniformDistribution(均勻分布),Normal Distribution /Guassian Distribution(正態分布/高斯分布),ExponentialDistribution(指數分布),Lognormal Distribution(對數正態分布),GammaDistribution(Gamma分布),Beta Distribution(Beta分布),Dirichlet Distribution(狄利克雷分布),Rayleigh Distribution(瑞利分布),Cauchy Distribution(柯西分布),Weibull Distribution (韋伯分布)

Three Sampling Distribution(三大抽樣分布):Chi-squareDistribution(卡方分布),t-distribution(t-distribution),F-distribution(F-分布)

Data Pre-processing(數據預處理)

Missing Value Imputation(缺失值填充),Discretization(離散化),Mapping(映射),Normalization(歸一化/標準化)。

Sampling(采樣):

Simple Random Sampling(簡單隨機采樣),OfflineSampling(離線等可能K采樣),Online Sampling(在線等可能K采樣),Ratio-based Sampling(等比例隨機采樣),Acceptance-RejectionSampling(接受-拒絕采樣),Importance Sampling(重要性采樣),MCMC(MarkovChain Monte Carlo 馬爾科夫蒙特卡羅采樣算法:Metropolis-Hasting& Gibbs)。

Clustering(聚類):

K-Means,K-Mediods,二分K-Means,FK-Means,Canopy,Spectral-KMeans(譜聚類),GMM-EM(混合高斯模型-期望最大化算法解決),K-Pototypes,CLARANS(基于劃分),BIRCH(基于層次),CURE(基于層次),DBSCAN(基于密度),CLIQUE(基于密度和基于網格)

Classification&Regression(分類&回歸):

LR(Linear Regression 線性回歸),LR(LogisticRegression邏輯回歸),SR(Softmax Regression 多分類邏輯回歸),GLM(GeneralizedLinear Model 廣義線性模型),RR(Ridge Regression 嶺回歸/L2正則最小二乘回歸),LASSO(Least Absolute Shrinkage andSelectionator Operator L1正則最小二乘回歸), RF(隨機森林),DT(DecisionTree決策樹),GBDT(Gradient BoostingDecision Tree 梯度下降決策樹),CART(ClassificationAnd Regression Tree 分類回歸樹),KNN(K-Nearest Neighbor K近鄰),SVM(Support VectorMachine),KF(KernelFunction 核函數PolynomialKernel Function 多項式核函數、Guassian KernelFunction 高斯核函數/Radial BasisFunction RBF徑向基函數、String KernelFunction 字符串核函數)、 NB(Naive Bayes 樸素貝葉斯),BN(Bayesian Network/Bayesian Belief Network/ Belief Network 貝葉斯網絡/貝葉斯信度網絡/信念網絡),LDA(Linear Discriminant Analysis/FisherLinear Discriminant 線性判別分析/Fisher線性判別),EL(Ensemble Learning集成學習Boosting,Bagging,Stacking),AdaBoost(Adaptive Boosting 自適應增強),MEM(MaximumEntropy Model最大熵模型)

Effectiveness Evaluation(分類效果評估):

Confusion Matrix(混淆矩陣),Precision(精確度),Recall(召回率),Accuracy(準確率),F-score(F得分),ROC Curve(ROC曲線),AUC(AUC面積),LiftCurve(Lift曲線) ,KS Curve(KS曲線)。

PGM(Probabilistic Graphical Models概率圖模型):

BN(Bayesian Network/Bayesian Belief Network/ BeliefNetwork 貝葉斯網絡/貝葉斯信度網絡/信念網絡),MC(Markov Chain 馬爾科夫鏈),HMM(HiddenMarkov Model 馬爾科夫模型),MEMM(Maximum Entropy Markov Model 最大熵馬爾科夫模型),CRF(ConditionalRandom Field 條件隨機場),MRF(MarkovRandom Field 馬爾科夫隨機場)。

NN(Neural Network神經網絡):

ANN(Artificial Neural Network 人工神經網絡),BP(Error BackPropagation 誤差反向傳播)

Deep Learning(深度學習):

Auto-encoder(自動編碼器),SAE(Stacked Auto-encoders堆疊自動編碼器:Sparse Auto-encoders稀疏自動編碼器、Denoising Auto-encoders去噪自動編碼器、Contractive Auto-encoders 收縮自動編碼器),RBM(RestrictedBoltzmann Machine 受限玻爾茲曼機),DBN(Deep Belief Network 深度信念網絡),CNN(ConvolutionalNeural Network 卷積神經網絡),Word2Vec(詞向量學習模型)。

DimensionalityReduction(降維):

LDA LinearDiscriminant Analysis/Fisher Linear Discriminant 線性判別分析/Fisher線性判別,PCA(Principal Component Analysis 主成分分析),ICA(IndependentComponent Analysis 獨立成分分析),SVD(Singular Value Decomposition 奇異值分解),FA(FactorAnalysis 因子分析法)。

Text Mining(文本挖掘):

VSM(Vector Space Model向量空間模型),Word2Vec(詞向量學習模型),TF(Term Frequency詞頻),TF-IDF(Term Frequency-Inverse DocumentFrequency 詞頻-逆向文檔頻率),MI(MutualInformation 互信息),ECE(Expected Cross Entropy 期望交叉熵),QEMI(二次信息熵),IG(InformationGain 信息增益),IGR(Information Gain Ratio 信息增益率),Gini(基尼系數),x2 Statistic(x2統計量),TEW(TextEvidence Weight文本證據權),OR(Odds Ratio 優勢率),N-Gram Model,LSA(Latent Semantic Analysis 潛在語義分析),PLSA(ProbabilisticLatent Semantic Analysis 基于概率的潛在語義分析),LDA(Latent DirichletAllocation 潛在狄利克雷模型)

Association Mining(關聯挖掘):

Apriori,FP-growth(Frequency Pattern Tree Growth 頻繁模式樹生長算法),AprioriAll,Spade。

Recommendation Engine(推薦引擎)

DBR(Demographic-based Recommendation 基于人口統計學的推薦),CBR(Context-basedRecommendation 基于內容的推薦),CF(Collaborative Filtering協同過濾),UCF(User-basedCollaborative Filtering Recommendation 基于用戶的協同過濾推薦),ICF(Item-basedCollaborative Filtering Recommendation 基于項目的協同過濾推薦)。

Similarity Measure&Distance Measure(相似性與距離度量):

Euclidean Distance(歐式距離),ManhattanDistance(曼哈頓距離),Chebyshev Distance(切比雪夫距離),MinkowskiDistance(閔可夫斯基距離),Standardized Euclidean Distance(標準化歐氏距離),MahalanobisDistance(馬氏距離),Cos(Cosine 余弦),HammingDistance/Edit Distance(漢明距離/編輯距離),JaccardDistance(杰卡德距離),Correlation Coefficient Distance(相關系數距離),InformationEntropy(信息熵),KL(Kullback-Leibler Divergence KL散度/Relative Entropy 相對熵)。

Optimization(最優化):

Non-constrainedOptimization(無約束優化):Cyclic VariableMethods(變量輪換法),Pattern Search Methods(模式搜索法),VariableSimplex Methods(可變單純形法),Gradient Descent Methods(梯度下降法),Newton Methods(牛頓法),Quasi-NewtonMethods(擬牛頓法),Conjugate Gradient Methods(共軛梯度法)。

ConstrainedOptimization(有約束優化):Approximation Programming Methods(近似規劃法),FeasibleDirection Methods(可行方向法),Penalty Function Methods(罰函數法),Multiplier Methods(乘子法)。

Heuristic Algorithm(啟發式算法),SA(SimulatedAnnealing,模擬退火算法),GA(genetic algorithm遺傳算法)

Feature Selection(特征選擇算法):

Mutual Information(互信息),DocumentFrequence(文檔頻率),Information Gain(信息增益),Chi-squared Test(卡方檢驗),Gini(基尼系數)。

Outlier Detection(異常點檢測算法):

Statistic-based(基于統計),Distance-based(基于距離),Density-based(基于密度),Clustering-based(基于聚類)。

Learning to Rank(基于學習的排序):

Pointwise:McRank;

Pairwise:RankingSVM,RankNet,Frank,RankBoost;

Listwise:AdaRank,SoftRank,LamdaMART;

Tool(工具):

MPI,Hadoop生態圈,Spark,BSP,Weka,Mahout,Scikit-learn,PyBrain…

轉載于:https://www.cnblogs.com/fuleying/p/4484346.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/273280.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/273280.shtml
英文地址,請注明出處:http://en.pswp.cn/news/273280.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

tomcat運行問題解決方法

早上過來遇到一個非常奇怪的問題,運行一個新的項目,運行環境都沒問題,可是在調試的時候,總是出錯。 錯誤代碼: log4j:WARN No appenders could be found for logger log4j:WARN Please initialize the log4j system p…

團隊開發——沖刺1.d

沖刺階段一(第四天) 1、昨天做了什么? 完成部分界面設置,補充三層難度界面、游戲結束界面。 2、今天準備做什么? 優化界面細節。查看C#資料,再解決自己電腦的問題。 3、遇到什么困難? 已經固定好…

10. javacript高級程序設計-DOM

1. DOM DOM(文檔對象模型)是針對HTML和XML文檔的一個API(應用程序接口) 1.1 節點層次 DOM可以將任何HTML和XML文檔描繪成一個由多層節點構成的結構。節點分為幾種不同的類型,每種類型分別表示文檔中不同的信息及標記。 1.1.1 Node類型 DOM1中…

hdu 5045 Contest(狀態壓縮DP)

題解&#xff1a;我們使用一個二位數組dp[i][j]記錄進行到第i個任務時&#xff0c;人組合為j時的最大和&#xff08;這里的j我們用二進制的每位相應一個人&#xff09;。 詳細見代碼&#xff1a; #include <iostream> #include <cstdio> #include <cstring> …

mysql001創建數據庫

-- 注釋&#xff0c;ctrl/ -- 查詢所有數據庫&#xff1b; show DATABASES; -- 創建數據庫; CREATE DATABASE studb; -- 切換數據庫; USE studb; -- 刪除數據庫 DROP DATABASE studb;

mysql002創建表

-- 創建student表 DDL CREATE TABLE stdent( sno int(3), name VARCHAR(55), sex CHAR(2), age int, dtdate date, classname VARCHAR(55), email VARCHAR(55) ) -- 查詢表中數據 DQL SELECT * FROM stdent;

oc基礎-self關鍵字的使用

#import <Foundation/Foundation.h>interface Student : NSObject {int _age;char *_name; } - (void) study; - (void) run; (void) play;(void) run; endimplementation Student - (void) study {NSLog("%s在學習",self->_name);[self run];//若在此調用…

mysql003操作表DDL

-- 查詢表中數據 DQL 注意在mydb數據庫下面 SELECT * FROM stdent; -- 在表中添加一列 DDL -- 新增列 默認添加到最后 ALTER TABLE stdent add score DOUBLE(4,1); -- 新增一列 在表中開頭添加 ALTER TABLE stdent add score2 double(5,1) first; -- 在指定列后面添…

Google Guava學習筆記——基礎工具類Joiner的使用

Guava 中有一些基礎的工具類&#xff0c;如下所列&#xff1a; 1&#xff0c;Joiner 類&#xff1a;根據給定的分隔符把字符串連接到一起。MapJoiner 執行相同的操作&#xff0c;但是針對 Map 的 key 和 value。 2&#xff0c;Splitter 類&#xff1a;與 Joiner 操作相反的類&a…

xampp 無法啟動mysql

Error: could not open single-table tablespace file .\test\dr.ibd 在網上搜索到的解決方案都不管用。結果整合了兩個解決方案&#xff1a; 刪掉xampp/data/ib_logfile0 xampp/data/ib_logfile1 xampp/data/ibdata1 三個文件就好了轉載于:https://www.cnblogs.com/fyydnz/p/4…

mysql005約束.列級別

-- 列級約束 -- sno 主鍵&#xff1a;唯一&#xff0c;不為空&#xff0c;自增 -- name 非空 -- sex 非空&#xff0c;默認值&#xff0c;只有男女 -- age 0-30歲 -- score 非空 -- dtdate 非空 -- classname 非空 -- email唯一 -- 創建表&#xff0c;增加列級約束 …

hdu.1430.魔板(bfs + 康托展開)

魔板 Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 2170 Accepted Submission(s): 455 Problem Description在魔方風靡全球之后不久&#xff0c;Rubik先生發明了它的簡化版——魔板。魔板由8個同樣大小的方…

mysql006添加外鍵約束

-- 添加外鍵 -- 建立主表&#xff0c;班級表 CREATE TABLE class( cno int PRIMARY key auto_increment, cname VARCHAR(55) ) SELECT * FROM class; -- 建立從表&#xff0c;學生表 CREATE table stu( sno int PRIMARY KEY auto_increment, sname VARCHAR(55), sex ch…

Circle-Progress-View

https://github.com/jakob-grabner/Circle-Progress-View 轉載于:https://www.cnblogs.com/eustoma/p/4507476.html

python1.學生管理系統

#定義函數界面 def info_print(): print("請選擇功能-----------") print("1.添加學員") print("2.刪除學員") print("3.修改學員") print("4.查詢學員") print("5.顯示所有學員") print("6.退出系統"…

初學JSP+Servlet常見的錯誤

web編程中常見的錯誤: 一、404(要訪問的資源沒有找到) 1.web程序有沒有部署(將項目到tomcat中) 2.url有沒有寫錯(包括大小寫&#xff0c;包括項目有沒有重命名) 3.有沒有將jsp/html放在WEB-INF 4.如果訪問的是servlet,那么看下web.xml中url-pattern中的配置和你寫的名字是否一致…

python2.面向對象學生管理系統

main.py(程序主入口) #1.導入管理系統模塊 from mangerSystem import * #2.啟動管理系統 #保證是當前文件運行才啟動管理系統&#xff1a;if -- 創建對象并調用run()方法 if __name__"__main__": student_managerStudentManager() student_manager.run() student…

elasticsearch 刪除滿足條件的語句_ELK從入門到還未精通(二)——ElasticSearch上篇

大家好&#xff0c;我是泥腿子安尼特&#xff0c;5個月沒在李佬都公眾號更新文章了。上一篇&#xff0c;大致介紹了作為工具人的我是如何基本使用這一套ELK 系統的。今天就講講這個最重要的E——基于Lucene的搜索引擎ElasticSearch(后面簡稱ES)。最近剛搬家&#xff0c;沒想到隔…

mysql004操作表.增刪改

-- 查詢表中數據 DQL 注意在mydb數據庫下面 SELECT * FROM stdent; -- 新增數據 這種寫法數據的循序和數據庫的字段循序保持一致。 INSERT INTO stdent values (1,"張三","男",25,"2021.1.1","java","123qq.com"); --…

python2.面向對象.學生管理

main.py(程序主入口) #1.導入管理系統模塊 from mangerSystem import * #2.啟動管理系統 #保證是當前文件運行才啟動管理系統&#xff1a;if -- 創建對象并調用run()方法 if __name__"__main__": student_managerStudentManager() student_manager.run() student…