2015-01-21 44 views
0

我想加載和使用數據集,以便在Matlab中運行一些算法(神經網絡)。我從互聯網上下載了一個具有實例和屬性的數據集。 我已將該數據集保存爲純文本文件,並使用擴展名.data或.mat。但我無法在Matlab中導入和使用它。 我該怎麼辦?之後我還必須定義一個訓練和一個測試集。 預先感謝您。 我不得不提到我是Matlab新手,並試圖將其作爲一種愛好來學習。Matlab分類加載數據集

+0

你能發佈一個數據鏈接嗎?你如何將它讀入matlab將取決於格式。 'dlmread'是一個很好的首選,但你也可以看看數據導入嚮導:http://www.mathworks.com/help/matlab/import_export/recommended-methods-for-importing-data.html?refresh =真。最後,Matlab確實也有自己的數據集:http://www.mathworks.com/help/stats/_bq9uxn4.html,這種fischer-iris套件在這類應用中非常流行。 – Dan 2015-01-21 11:50:21

+0

這裏是鏈接http://archive.ics.uci.edu/ml/datasets/Wine。另外,我不確定如何創建訓練和測試集。 – utiliopt 2015-01-21 11:56:52

+0

['csvread'](http://www.mathworks.com/help/matlab/ref/csvread.html)將處理您輸入的'wine.data'。使用':'運算符可以簡化任務的集合。你應該詳細說明你到底在幹什麼 – Dan 2015-01-21 12:06:23

回答

1

您可以只用加載數據:

data = load('wine.data'); 

然後,您可以將數據分割到訓練和測試很容易。 在這裏,我將70%的訓練數據和30%的數據用於測試,但您可以選擇其他分數。 60-40或80-20

data = data(randperm(end), :); 

traindata = data(1:floor(0.7*size(data, 1)), :); 
testdata = data(floor(0.7*size(data, 1))+1:end, :); 

最後,當你想運行分類,請記住,在這個數據集,第一列是標籤,其餘均爲功能。

+0

http://meta.stackexchange.com/questions/22186/how-do-i-format-my-code-blocks – rayryeng 2015-01-21 21:45:39

+1

你應該解釋一下你到底在哪裏的門檻正在分裂你的數據。看起來你選擇70%的數據作爲訓練,30%作爲測試,但這對新手程序員來說並不明顯。我建議將這些信息放入您的帖子中。 – rayryeng 2015-01-21 21:46:45

+0

謝謝大家的回答。 – utiliopt 2015-01-22 07:24:52