柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)挖掘 聚類與分類的區(qū)別
聚類和分類是機(jī)器學(xué)習(xí)中的兩個(gè)基本概念,兩者的主要區(qū)別在于用于分類的數(shù)據(jù)已經(jīng)預(yù)先標(biāo)記好類別,而用于聚類的數(shù)據(jù)則沒有預(yù)先標(biāo)記的類別。以下是詳細(xì)介紹:
目的不同。聚類的目的是發(fā)現(xiàn)數(shù)據(jù)中的自然分組,將相似或相關(guān)的對(duì)象組織在一起,形成一個(gè)或多個(gè)集群(cluster),以便更好地理解和分析數(shù)據(jù);分類的目的是基于已有的分類體系或規(guī)則,將新數(shù)據(jù)點(diǎn)分配到預(yù)定義的類別中。學(xué)習(xí)方式不同。聚類是一種無監(jiān)督學(xué)習(xí),因?yàn)樗灰蕾囉陬A(yù)先定義的類別或帶類標(biāo)的訓(xùn)練實(shí)例,而是基于觀察和學(xué)習(xí),試圖發(fā)現(xiàn)數(shù)據(jù)中的隱藏模式;分類是一種有監(jiān)督學(xué)習(xí),它依賴于預(yù)先定義的類別和帶類標(biāo)的訓(xùn)練實(shí)例,通過訓(xùn)練得到分類器,然后使用這個(gè)分類器對(duì)新的數(shù)據(jù)點(diǎn)進(jìn)行分類。應(yīng)用場(chǎng)景不同。聚類更適用于沒有明確分類體系或分類體系未知的情況,如市場(chǎng)細(xì)分、圖像識(shí)別等;分類更適用于已經(jīng)存在明確的分類體系的情況,如垃圾郵件識(shí)別、疾病診斷等。類別數(shù)量的確定性不同。聚類分析中,類別數(shù)量通常是不確定的,并且在聚類過程中自動(dòng)生成;分類分析中,類別數(shù)量是固定的,在分析之前已經(jīng)確定。
柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)挖掘 聚類與分類的區(qū)別
文章來源
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。