欧美free性护士vide0shd,老熟女,一区二区三区,久久久久夜夜夜精品国产,久久久久久综合网天天,欧美成人护士h版

首頁綜合正文

評論

柚子快報邀請碼778899分享：平臺數(shù)據(jù)分類與聚類實驗報告

亞馬遜全球貿通綜合2025-05-05440

柚子快報邀請碼778899分享：平臺數(shù)據(jù)分類與聚類實驗報告

http://yzkb.51969.com/

參考書籍：《數(shù)據(jù)流挖掘與在線學習算法》? 李志杰

1.6.1 實驗目的

本書內容以及課程實驗主要涉及Java程序設計語言、數(shù)據(jù)挖掘工具Weka和數(shù)據(jù)流機器學習平臺MOA，因此，需要安裝、配置并熟悉實驗環(huán)境。Java、Weka和MOA都是開源小軟件，簡單易用，都可以在個人電腦的這些實驗環(huán)境下完成。

1.6.2 實驗環(huán)境

(1) 操作系統(tǒng)：Windows 10

(2) Java：1.8.0_181-b13

(3) Weka：3.8.4

(4) MOA：release-2020.07.1

1.6.3　安裝平臺

(1) Java安裝與配置

最新標準版Java 可從Oracle官方網站https://www.oracle.com/免費下載，如下圖所示。

安裝JDK后，必須配置PATH環(huán)境變量和CLASSPATH環(huán)境變量才能使用，操作如下。

右擊“我的電腦”→屬性→高級系統(tǒng)設置→環(huán)境變量，如圖所示進行配置。

下圖中，JAVA_HOME配置為JDK安裝路徑：C:/Program Files/Java/jdk1.8.0-181。Java的PATH環(huán)境變量和CLASSPATH環(huán)境變量直接加在后面，每項用“?;”隔開。CLASSPATH最前面的“.”表示當前路徑。

配置完成后，點擊“開始”→Windows系統(tǒng)→命令提示符，輸入：javac。如無錯誤提示，則配置成功。

(2) Eclipse集成開發(fā)環(huán)境

Eclipse是常用的Java集成開發(fā)環(huán)境，可以從官網http://www.eclipse.org/downloads/免費下載。

(3) Weka安裝

安裝配置好Java后，可以從官網http://www.cs.waikato.ac.nz/～ml/weka/免費下載Weka。也可從本書官網“下載專區(qū)”目錄下獲得weka-3-8-4-azul-zulu-windows安裝文件。

安裝完成后，安裝路徑的data子目錄下自帶23個ARFF格式的示例數(shù)據(jù)集。

(4) MOA安裝

MOA基于Java和Weka環(huán)境，可從官方網站https://moa.cms.waikato.ac.nz/免費下載。也可從本書官網“下載專區(qū)”目錄下獲得MOA壓縮文件moa-release-2020.07.1-bin。

MOA壓縮包中包括moa.jar和sizeofag.jar等文件，無須安裝。解包后雙擊子目錄bin/moa.bat，即可啟動MOA。

1.6.4　平臺操作

(1) Weka圖形用戶界面

啟動Weka，單擊探索者Explorer按鈕，Weka?GUI如圖1.37所示。加載一個數(shù)據(jù)集weather.nominal.arff，標簽頁Preprocess(預處理)、Classify(分類)、Cluster(聚類)、Associate(關聯(lián)分析)、Select attributes(屬性選擇)、Visualize(可視化)等都變?yōu)榭梢允褂谩?/p>

(2) Eclipse環(huán)境下Weka?API操作

除了GUI外，Weka還定義了應用程序編程接口API，很容易“嵌入”到Eclipse用戶自己的Java項目中。

在Eclipse中新建一個名為Weka的項目，右擊Weka，點擊Properties，Java Build Path→Libraries→Add External JARs，選中Weka安裝目錄下的weka.jar，添加到庫中，如圖所示。

以加載weather.nominal.arff和weather.numeric.arff為例，示例代碼見程序清單1.1。

程序清單1.1?加載ARFF文件

package weka;

import weka.core.Instances;

import weka.core.converters.ArffLoader;

import weka.core.converters.ConverterUtils.DataSource;

import java.io.File;

public class LoadArffFile {

public static void main(String[] args) throws Exception {

Instances data1=DataSource.read("C:/Program Files/Weka-3-8-4/data/weather.nominal.arff");

System.out.println(data1);

ArffLoader loader=new ArffLoader();

loader.setSource(new File("C:/Program Files/Weka-3-8-4/data/weather.numeric.arff"));

Instances data2=loader.getDataSet();

System.out.println(data2);

}

(3) MOA圖形用戶界面

雙擊MOA子目錄bin下moa.bat文件，即可啟動MOA GUI。如圖所示，通過點擊Configure來設置某項任務。

(4) Eclipse環(huán)境下MOA?API操作

與Weka類似，除了GUI外，MOA還定義了應用程序編程接口API，很容易“嵌入”到Eclipse用戶自己的Java項目中。

在Eclipse中新建一個MOA的項目，右擊該項目，點擊Properties，Java Build Path→Libraries→Add External JARs，選中下載包中的moa.jar和sizeofag.jar等文件，添加到庫中，如圖所示。

B　實驗1報告-2 ?數(shù)據(jù)分類

2.5.1?實驗目的

(1) 理解有監(jiān)督數(shù)據(jù)分類原理與過程。

(2) 熟悉Weka分類操作。

(3) 熟悉MOA分類操作。

2.5.2?實驗環(huán)境

(1) 操作系統(tǒng)：Windows 10

(2) Java：1.8.0_181-b13

(3) Weka：3.8.4

(4) MOA：release-2020.07.1

2.5.3 Weka分類

(1) 使用C4.5算法分類器

C4.5算法在Weka中實現(xiàn)為J48分類器，下面在Weka平臺中使用J48分類器訓練weather.nominal.arff數(shù)據(jù)集。

啟動Weka→Explorer→Open file→weather.nominal.arff→Classify→Choose→trees→J48→Start，訓練集構建J48分類器模型如上圖所示。

右擊圖2.10的Result list區(qū)域中新生成條目→Visualize tree，彈出下圖所示的決策樹視圖窗口。

(2) 使用分類器預測未知數(shù)據(jù)

構建圖2.12所示的測試數(shù)據(jù)集test.arff，使用圖2.11的決策樹進行預測。

圖2.10的Test options區(qū)域，點擊Supplied test set→Set→Open file→test.arff→Close→More options→Choose→PlainTest→OK→Start，則啟動評估過程后，會發(fā)現(xiàn)多了一項測試集的預測結果，如下圖所示。結果表明，測試集三個實例，其中兩個預測正確，一個預測錯誤。

(3) 構建J48批量分類器

本示例用Java代碼構建一個J48批量分類器，示例代碼見程序清單2.1。

程序清單2.1構建J48批量分類器

import weka.classifiers.trees.J48;

import weka.core.Instances;

import weka.core.converters.ArffLoader;

import java.io.File;

public class J48Classifier {

???public static void main(String[] args) throws Exception {

???ArffLoader loader=new ArffLoader();

???loader.setFile(new File("C:/Program Files/Weka-3-8-4/data/weather.nominal.arff"));

???Instances data=loader.getDataSet();

???data.setClassIndex(data.numAttributes()-1);

???

???String[] options=new String[1];

???options[0]="-U";

???J48 tree=new J48();

???tree.setOptions(options);

???tree.buildClassifier(data);

???

???System.out.println(tree);

???}

}

在Eclipse中運行代碼，輸出訓練好的決策樹模型，如下圖所示。

2.5.4 MOA分類

(1) 使用NaiveBayes分類器

①?LearnModel

???????啟動MOA→Classification→Configure→tasks.LearnModel。

???選擇：learner→bayes.NaiveBayes，stream→WaveformGenerator，maxInstances→1000000，taskResultFile→modelNB.moa。

???????????點擊Run，則NaiveBayes模型存儲到modelNB.moa中。

②?EvaluateModel

???????????點擊Configure→tasks.EvaluateModel。

???選擇：stream→WaveformGenerator→instanceRandomSeed→2，maxInstances→1000000，然而，model無法選擇到modelNB.moa，所有這里我們需要自己創(chuàng)建一個modelNB.moa。

???點擊“確定”返回到Configure→右擊命令行→Copy configuration to clipboard→Enter configuration→編輯配置-m file: modelNB.moa。任務命令行變?yōu)椋篍valuateModel -m file:modelNB.moa -s (generators.WaveformGenerator -i 2) -i 1000000。

??????點擊Run運行。由于輸出頻率為100000步，中間面板有10項文字輸出，結果如下圖所示。

③?EvaluatePeriodicHeldOutTest

???????????點擊Configure→tasks. EvaluatePeriodicHeldOutTest。

???選擇：learner→bayes.NaiveBayes，stream→WaveformGenerator，testSize→100000，trainSize→10000000，sampleFrequency→1000000。

???點擊Run運行。從下圖可看到，中間面板有10項文字輸出，底部面板顯示最終統(tǒng)計與可視化結果。最終的準確率是80.48%。

④?EvaluateInterleavedTestThenTrain

???點擊Configure→tasks. EvaluateInterleavedTestThenTrain。

???選擇：learner→bayes.NaiveBayes，stream→WaveformGenerator，instanceLimit→1000000，sampleFrequency→10000。

???點擊Run運行。從下圖可看到，中間面板有100項文字輸出，底部面板顯示最終統(tǒng)計與可視化結果。最終的準確率是80.47%。

⑤?EvaluatePrequential

???點擊Configure→tasks. EvaluatePrequential。

???選擇：learner→bayes.NaiveBayes，stream→WaveformGenerator，evaluator→WindowClassificationPerformanceEvaluator→width→1000，instanceLimit→1000000，sampleFrequency→10000。

???點擊Run運行。從下圖可看到，中間面板有100項文字輸出，底部面板顯示最終統(tǒng)計與跳躍的鋸齒形可視化結果。最終的準確率是80.30%。

(2) 使用Hoeffding樹分類器

①?使用EvaluateModel嵌套LearnModel評估Hoeffding樹

???????????點擊Configure→tasks.EvaluateModel。

???選擇：model→tasks.LearnModel→learner →trees. HoeffdingTree→stream→WaveformGenerator→maxInstances→1000000，stream→WaveformGenerator→instanceRandomSeed→2，maxInstances→1000000。

???點擊“確定”返回到Configure。任務命令行為：EvaluateModel -m (LearnModel -l trees.HoeffdingTree -s generators.WaveformGenerator -m 1000000) -s (generators.WaveformGenerator -i 2) -i 1000000 -f 10000。

??????點擊Run運行，結果如下圖所示。

②?EvaluatePeriodicHeldOutTest、EvaluateInterleavedTestThenTrain和EvaluatePrequential

與NaiveBayes類似，Hoeffding樹也可以分別使用數(shù)據(jù)流三種評估方式：EvaluatePeriodicHeldOutTest(在一個保留測試集上周期性截取性能快照)、EvaluateInterleavedTestThenTrain(交錯式測試-訓練評估法)和EvaluatePrequential(先序評估法)。評估Hoeffding樹具體操作與上面(1)中NaiveBayes的操作類似。

事實上，MOA GUI底部可同時顯示當前任務和之前任務的可視化結果，當前任務為紅色，之前任務為藍色。因此，比較NaiveBayes與Hoeffding樹分類器性能非常方便和直觀。

C　實驗1報告-3 ?數(shù)據(jù)聚類

3.9.1 實驗目的

(1) 理解無監(jiān)督數(shù)據(jù)聚類原理與過程。

(2) 熟悉Weka聚類操作。

(3) 熟悉MOA聚類操作。

3.9.2 實驗環(huán)境

(1) 操作系統(tǒng)：Windows 10

(2) Java：1.8.0_181-b13

(3) Weka：3.8.4

(4) MOA：release-2020.07.1

3.9.3 Weka聚類

聚類屬于典型的的無監(jiān)督學習方式，聚類對象是沒有標簽的實例或數(shù)據(jù)點。聚類的任務是要根據(jù)實例間的相似性進行分組，之前這些分組是未知的。

(1) 使用K-Means算法聚類

K-Means算法又稱為K均值算法，是一種對數(shù)據(jù)集進行批量聚類的無監(jiān)督學習算法。它依靠數(shù)據(jù)點彼此之間的距離遠近對其進行分組，將一個給定的數(shù)據(jù)集分類為k個聚類。算法不斷進行迭代計算和調整，直到達到一個理想的結果。K-Means算法在Weka平臺實現(xiàn)為SimpleKMeans。

SimpleKMeans算法有兩個重要參數(shù)，一個是distanceFunction，默認EuclideanDistance?；另一個是numClusters，默認值2。

下面以weather.numeric.arff數(shù)據(jù)集為例，使用SimpleKMeans算法聚類操作。聚類結果如圖3.15所示。

啟動Weka→Explorer→Open file→weather.numeric.arff→Cluster→Choose→SimpleKMeans→Ignore attributes→play→Select。

單擊Start，聚類過程開始。

(2) 使用DBSCAN和OPTICS算法

這里我們的waka里面是沒有這兩個算法的，需要自己導包進去

導包過程參考：向weka 中添加DBSCAN算法_weka dbscan-CSDN博客

DBSCAN是經典的密度批量聚類算法，其基本思想是鄰域內含有大量點的核心點構建聚類。算法以任意順序訪問數(shù)據(jù)點，如果該點為核心點，則該點與其所有可達的數(shù)據(jù)點形成新的聚類。非核心點則標為“離群值”，直到有一個新的核心點與“離群值”可達，“離群值”才加入該聚類。

DBSCAN密度方法可以聚類非球形形狀的數(shù)據(jù)，這是K -均值聚類方法難以做到的。OPTICS算法則在層次聚類方面擴展了DBSCAN算法。

以鳶尾花數(shù)據(jù)集為例，使用Weka平臺的DBSCAN和OPTICS算法，操作和顯示結果如下。

啟動Weka→Explorer→Open file→iris.arff→Cluster→Choose→DBSCAN，選擇了DBSCAN聚類算法。

點擊Choose右邊DBSCAN的文本框→參數(shù)epsilion=0.2→參數(shù)minPoints=5→OK。

點擊Ignore attributes→class→Select。

單擊Start，DBSCAN聚類結果如下圖所示。

使用OPTICS對鳶尾花數(shù)據(jù)集聚類，操作過程類似于DBSCAN。

選擇OPTICS聚類算法后，設OPTICS參數(shù)epsilion=0.2、minPoints=5。

單擊Start運行，OPTICS可視化窗口自動彈出，窗口包括Table和Graph兩個標簽，分別以表格和圖形顯示聚類結果。

下圖的圖形標簽頁中，峰值中間夾著的兩個山谷，對應OPTICS找到的兩個簇。

柚子快報邀請碼778899分享：平臺數(shù)據(jù)分類與聚類實驗報告

http://yzkb.51969.com/

好文閱讀

評論可見，查看隱藏內容

本文內容根據(jù)網絡資料整理，出于傳遞更多信息之目的，不代表金鑰匙跨境贊同其觀點和立場。

轉載請注明，如有侵權，聯(lián)系刪除。

本文鏈接：http://gantiao.com.cn/post/19550609.html

發(fā)布評論

取消回復

您暫未設置收款碼

請在主題配置——文章設置里上傳

金鑰匙跨境

掃描二維碼手機訪問

文章目錄

<em id="ygttf"><samp id="ygttf"></samp></em>

欧美free性护士vide0shd,老熟女,一区二区三区,久久久久夜夜夜精品国产,久久久久久综合网天天,欧美成人护士h版

柚子快報邀請碼778899分享：平臺數(shù)據(jù)分類與聚類實驗報告

隨便看看

特朗普要求美國最高法院暫停執(zhí)行TikTok強制出售令

最新留言

您暫未設置收款碼