在一些研究,我發現了兩個功能的MATLAB做任務:在生物信息工具箱 在MATLAB中將數據拆分爲訓練/測試數據集?
統計工具箱
crossvalind
功能
cvpartition
功能現在的我在使用cvpartition
創建n-fold交叉驗證子集之前,以及來自Sta的Dataset
/Nominal
類tistics工具箱。所以我只是想知道兩者之間的區別和每個人的利弊有哪些?
在一些研究,我發現了兩個功能的MATLAB做任務:在生物信息工具箱 在MATLAB中將數據拆分爲訓練/測試數據集?
統計工具箱
crossvalind
功能
cvpartition
功能現在的我在使用cvpartition
創建n-fold交叉驗證子集之前,以及來自Sta的Dataset
/Nominal
類tistics工具箱。所以我只是想知道兩者之間的區別和每個人的利弊有哪些?他們看起來基於cvpartition和crossvalind的官方文檔是非常相似的,但crossvalind看起來更靈活一點(它允許請假次M,對於任意男,而cvpartition只允許請假1)。
...是不是真的,你可以使用kfold交叉驗證與適當的K值(數據分割成k倍,測試始終模擬假-M-出來一個,列車上的所有其他人,併爲所有褶皺做這件事,並取平均值),因爲leave-one-out是kfold的特例,其中k =觀察次數?
他們看起來非常相似,基於cvpartition和crossvalind的官方文檔,但crossvalind看起來稍微更加靈活(它允許爲任意M留下M out,而cvpartition只允許leave 1)。
我知道你的問題沒有直接指向神經網絡工具箱,但也許別人可能會覺得這很有用。爲了將您的ANN輸入數據分離到測試/驗證/訓練數據中,請使用'net.divideFcn'變量。
net.divideFcn = 'divideind';
net.divideParam.trainInd=1:94; % The first 94 inputs are for training.
net.divideParam.valInd=1:94; % The first 94 inputs are for validation.
net.divideParam.testInd=95:100; % The last 5 inputs are for testing the network.
銀行,這是不是直接回答你的cvpartition
VS crossvalind
的問題,但在Mathworks公司文件交換,包括一個不錯的功能集枚舉數組下標作一份貢獻稱爲MulticlassGentleAdaboosting用戶塞巴斯蒂安巴黎計算訓練,以下采樣和交叉驗證策略的測試和驗證集:
有關詳細信息,請參閱包含在演示文件在封裝中,更具體地說功能sampling.m
和sampling_set.m
。
+1有用,謝謝分享 – Amro 2011-09-09 12:36:14