柚子快報激活碼778899分享:數(shù)據(jù)挖掘期末突擊
柚子快報激活碼778899分享:數(shù)據(jù)挖掘期末突擊
目錄
1.英文縮寫變英文全稱,20個抽10個,20分
2.判斷,10個,10分,概念 ,選擇,10個,30分,概念
第五章層次聚類
第六章UPGMA WPGMA
第七章主成分分析PCA
第九章 非線性降維
MDS
lsomap
第十三章 回歸的觀點
4.寫出算法正確排序,10抽4,20分
MDS 非線性降維
LLE 非線性降維
LDA 降維和分類
PCA 降維
CCA 降維
ACE
CV 交叉驗證
Kmeans
AGNES
DIANA
5.計算,6抽2,20分
混淆矩陣
TF-IDF頻率之數(shù)
層次聚類樹
Kmeans聚類
相關(guān)系數(shù)
KNN
?
1.英文縮寫變英文全稱,20個抽10個,20分
IR——Information Retrieval 信息檢索
BOW——Bag of Words 詞袋模型
DTM——document-term matrix 文檔詞項矩陣
TF-IDF——Term Frequency-Inverse Document Frequency 詞頻-逆文檔頻率
AGNES——Agglomerative Nesting 凝聚嵌套
DIANA——Divisive Analysis 分裂分析
UPGMA——Unweighted Pair Group Method with Arithmetic Mean 非加權(quán)組平均法
WPGMA——Weighted Pair Group Method with Arithmetic Mean 加權(quán)組平均法
PCA——Principal Component Analysis 主成分分析
CCA——Canonical Correlation Analysis 典型相關(guān)分析
MDS——Multidimensional Scaling 多維標度
LDA——Linear Discriminant Analysis 線性判別分析
KNN——K-Nearest Neighbor?K最近鄰
ACE——Alternating Conditional Expectations 交替條件期望
OLSE——Ordinary Least Square?Estimation 普通最小二乘估計
BLUE——Best Linear Unbiased Estimate 最佳線性無偏估計量
SVM——Support Vector Machine 支持向量機
ROC——Receiver Operating Characteristic 受試者工作特征曲線
AUC——Area Under the Curve 曲線下面積
SVD——Singular Value Decomposition 奇異值分解
Lasso——Least Absolute Shrinkage and Selection Operator 最小絕對值收縮和選擇算子
2.判斷,10個,10分,概念 ,選擇,10個,30分,概念
?
第五章層次聚類
平均連接
第六章UPGMA WPGMA
第七章主成分分析PCA
第九章 非線性降維
MDS
lsomap
第十三章 回歸的觀點
4.寫出算法正確排序,10抽4,20分
MDS 非線性降維
python與人工智能-數(shù)據(jù)降維-MDS_嗶哩嗶哩_bilibili
D為原維度dij的距離矩陣
優(yōu)點:直觀可視化:MDS能夠?qū)⒏呔S數(shù)據(jù)映射到二維或三維空間,便于直觀地觀察數(shù)據(jù)分布和結(jié)構(gòu)。
保持距離關(guān)系:MDS在低維空間中盡可能保留了原始數(shù)據(jù)的距離結(jié)構(gòu),有助于發(fā)現(xiàn)潛在的聚類或模式。
適用范圍廣:無論是度量還是非度量數(shù)據(jù),MDS都能找到合適的處理方法。
缺點:對距離矩陣依賴性強:MDS結(jié)果的可靠性很大程度上取決于輸入的距離矩陣的質(zhì)量。若距離矩陣計算不當或含有噪聲,可能導致映射結(jié)果失真。
解釋性有限:雖然MDS能夠生成可視化結(jié)果,但對于映射到低維空間后的具體坐標值,其物理或?qū)嶋H意義可能不明確。
與PCA對比:主成分分析(PCA)也是一種降維方法,但其目標是最大化數(shù)據(jù)方差的保留,而非保持距離關(guān)系。PCA更適合于線性相關(guān)性強的數(shù)據(jù)集,而MDS對非線性關(guān)系的處理能力更強。
?
LLE 非線性降維
http://t.csdnimg.cn/PUcMW
?
python與人工智能-數(shù)據(jù)降維-LLE_嗶哩嗶哩_bilibili
LDA 降維和分類
?
?
?
PCA 降維
PCA----principal component analysis主成分分析
用最直觀的方式告訴你:什么是主成分分析PCA_嗶哩嗶哩_bilibili
(1)去平均值
(2)求協(xié)方差矩陣
(3)求協(xié)方差矩陣的特征值和特征向量
(4)構(gòu)建投影矩陣 P
(5)用P的第一行乘以數(shù)據(jù)矩陣,得到降維后的表示
?
CCA 降維
?
?
ACE
?
?
CV 交叉驗證
【深度學習 搞笑教程】06 交叉驗證 | 草履蟲都能聽懂 零基礎(chǔ)入門 | 持續(xù)更新_嗶哩嗶哩_bilibili
?
Kmeans
初始化,分配簇,更新質(zhì)心,迭代,優(yōu)化目標
?
?
AGNES
?
?
DIANA
?
?
?
?
5.計算,6抽2,20分
混淆矩陣
?
準確度:(TP+TN)/(TP+FP+FN+TN)
?
?
TF-IDF頻率之數(shù)
TF-IDF簡介_嗶哩嗶哩_bilibili
?
?
?
IDF(尾巴)=log(10/2)=0.698=0.7
IDF(嘴巴)=log(10/11)=-0.041
例題
?
?
?
?
層次聚類樹
AGNES算法
層次聚類的基本原理_嗶哩嗶哩_bilibili
例1.
例2.
DIANA
divisive clustering(DIANA)分裂層次聚類(帶計算實例)_嗶哩嗶哩_bilibili
?
Kmeans聚類
聚類問題:聚類算法+K-Means算法詳解+考試例題講解_嗶哩嗶哩_bilibili
?
?
?
?
?
?
?
相關(guān)系數(shù)
?
?
?
?
?
?
?
?
KNN
http://t.csdnimg.cn/HbDXn
分類問題:分類算法+KNN算法詳解+考試例題講解_嗶哩嗶哩_bilibili
?
期末數(shù)據(jù)挖掘KNN算法 計算大題(自用版)_嗶哩嗶哩_bilibili
例1
例2
例3
?
?
?
?
?
柚子快報激活碼778899分享:數(shù)據(jù)挖掘期末突擊
推薦鏈接
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。