2011-10-01 34 views
1

您好我有這樣表示一些數據多數民衆贊成:模糊C均值在MATLAB TCP轉儲集羣

從中根據DARPA的集KDD杯1999年
0,tcp,http,SF,239,486,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0.00,0.00,19,19,1.00,0.00,0.05,0.00,0.00,0.00,0.00,0.00,normal. 

它。

我擁有的文本文件具有這樣的行和行數據,在matlab中有可以通過鍵入findcluster使用的通用集羣工具,但它只接受.dat文件。

我也不太確定它是否會接受這樣的格式。我也不知道爲什麼轉儲文件中有這麼多尾隨零。

任何人都可以幫助我如何利用文本文件,並運行它通過matlab中的fcm聚類方法?代碼幫助真的需要。

回答

2

FINDCLUSTER簡直是兩個聚類算法GUI界面:FCMSUBCLUST

首先,您需要從文件中讀取數據,尋找到TEXTSCAN函數,該函數。

然後你需要處理非數字屬性;刪除它們或以某種方式轉換它們。據我所知,這兩種算法只支持數字數據。

訪問KDD cup數據集的原始網站,找出每個屬性的描述。