柚子快報激活碼778899分享:kmeans聚類算法
1:kmeans聚類算法的含義
K-means算法是最為經(jīng)典的基于劃分的聚類方法,是十大經(jīng)典數(shù)據(jù)挖掘算法之一。 K-means算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近他們的對象歸類。 通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果
算法又名k均值算法,K-means算法中的k表示的是聚類為k個簇,means代表取每一個聚類中數(shù)據(jù)值的均值作為該簇的中心,或者稱為質(zhì)心,即用每一個的類的質(zhì)心對該簇進行描述。 ? ? ? ? 其算法思想大致為:先從樣本集中隨機選取 k個樣本作為簇中心,并計算所有樣本與這 k個“簇中心”的距離,對于每一個樣本,將其劃分到與其距離最近的“簇中心”所在的簇中,對于新的簇計算各個簇的新的“簇中心”。 ? ? ? ? 根據(jù)以上描述,我們大致可以猜測到實現(xiàn)kmeans算法的主要四點: ??? ? ? ? (1)簇個數(shù) k 的選擇 ??? ? ? ? (2)各個樣本點到“簇中心”的距離 ??? ? ? ? (3)根據(jù)新劃分的簇,更新“簇中心” ??? ? ? ? (4)重復(fù)上述2、3過程,直至"簇中心"沒有移動 ? ? ? ? 優(yōu)缺點:
優(yōu)點:容易實現(xiàn) 缺點:可能收斂到局部最小值,在大規(guī)模數(shù)據(jù)上收斂較慢2.K-means算法步驟詳解
Step1.K值的選擇
k 的選擇一般是按照實際需求進行決定,或在實現(xiàn)算法時直接給定 k 值
說明:A
柚子快報激活碼778899分享:kmeans聚類算法
相關(guān)鏈接
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。