2013-04-30 41 views
1

我遇到過各種方法來找出隨機數據集在MATLAB中分類器的訓練,如crossvalcvpartition等我已經通過所有的例子,但無法理解他們正確。我要做到以下幾點:正確的方法來選擇統計隨機數據集在matlab中cotraining

  1. 我有隨機劃分的數據集爲訓練和測試數據集
  2. 然後訓練集,我需要隨機選擇對於那些誰是熟悉共2個數據點(標示數據中)
  3. 最後,我需要從分類器中獲得平均準確度。

編輯:我的數據集看起來像這樣:

0.1 0.2 0.2 1 22 40
0.0 0.1 0.3 0 33 30
0.5 0.5 0.5 1 10 11

依此類推

該數據集非常類似40行70列

+0

請至少提供一個小例子數據集。 – 2013-04-30 08:28:46

+0

@RoneyMichael我提供了一個小例子,展示了我的數據集的外觀。它是'40 * 70'的數字矩陣。 – MaxSteel 2013-04-30 08:33:32

+0

訓練和測試數據集的大小是否有任何限制? – 2013-04-30 08:35:14

回答

0

如果我正確理解你的問題,你的每一行代表一個特定的記錄。如果是這樣,你可以嘗試這樣的事情:

>> training_data = my_dataset(randsample(40,ceil(0.3*40)),:); 
>> test_data = my_dataset(setdiff(1:40,randsample(40,ceil(0.3*40))),:); 
>> two_points = training_data(randsample(ceil(0.3*40),2),:); 
+0

我明白你的答案,但每次我都會運行它,我會得到不同的結果。我希望得到所有可能組合的平均結果,就像'crossval'一樣。 – MaxSteel 2013-04-30 08:46:21

+0

對不起,但爲什麼你不能使用'crossval'本身? – 2013-04-30 08:52:47

+0

我不知道如何在這種情況下使用它。我可以用它來平均測試/訓練數據的所有組合,但我必須選擇兩點來進行合作訓練。我不知道該怎麼做, – MaxSteel 2013-04-30 09:06:38