在MATLAB中將數據拆分爲訓練/測試數據集？

在一些研究，我發現了兩個功能的MATLAB做任務：在生物信息工具箱在MATLAB中將數據拆分爲訓練/測試數據集？

統計工具箱

crossvalind功能

cvpartition功能現在的我在使用cvpartition創建n-fold交叉驗證子集之前，以及來自Sta的Dataset/Nominal類tistics工具箱。所以我只是想知道兩者之間的區別和每個人的利弊有哪些？

來源

2009-09-03 Amro

擴展在@Mr Fooz's answer

他們看起來基於cvpartition和crossvalind的官方文檔是非常相似的，但crossvalind看起來更靈活一點（它允許請假次M，對於任意男，而cvpartition只允許請假1）。

...是不是真的，你可以使用kfold交叉驗證與適當的K值（數據分割成k倍，測試始終模擬假-M-出來一個，列車上的所有其他人，併爲所有褶皺做這件事，並取平均值），因爲leave-one-out是kfold的特例，其中k =觀察次數？

來源

2009-09-03 19:40:14

他們看起來非常相似，基於cvpartition和crossvalind的官方文檔，但crossvalind看起來稍微更加靈活（它允許爲任意M留下M out，而cvpartition只允許leave 1）。

來源

2009-09-03 11:45:56

我知道你的問題沒有直接指向神經網絡工具箱，但也許別人可能會覺得這很有用。爲了將您的ANN輸入數據分離到測試/驗證/訓練數據中，請使用'net.divideFcn'變量。

net.divideFcn = 'divideind'; 

net.divideParam.trainInd=1:94; % The first 94 inputs are for training. 
net.divideParam.valInd=1:94; % The first 94 inputs are for validation. 
net.divideParam.testInd=95:100; % The last 5 inputs are for testing the network.

來源

2011-04-24 06:52:36 Aman

銀行，這是不是直接回答你的cvpartition VS crossvalind的問題，但在Mathworks公司文件交換，包括一個不錯的功能集枚舉數組下標作一份貢獻稱爲MulticlassGentleAdaboosting用戶塞巴斯蒂安巴黎計算訓練，以下采樣和交叉驗證策略的測試和驗證集：

抱
引導
個ķ交叉驗證
留出一個
分層交叉驗證
平衡分層交叉驗證
分層抱
分層啓動捆綁

有關詳細信息，請參閱包含在演示文件在封裝中，更具體地說功能sampling.m和sampling_set.m。

來源

2011-09-08 20:46:35

+1有用，謝謝分享 – Amro 2011-09-09 12:36:14

在MATLAB中將數據拆分爲訓練/測試數據集？

回答

相關問題