2
輸入與約束驗證:如何使用交叉scikit學習
- 我有其中每行是表示人的示例圖像的陣列
X
。 - 另一個陣列
y
爲它們的標籤,其中標籤是1和7 - 和
ids
最後陣列,其中ids[i]
表示第i人的在X[i]
的ID之間的整數。 (同一人具有相同的ID,並有可能是同一人的不同的圖像。)
是否有可能劃分X
和y
,使同一人不進入這兩個試驗和訓練集?我想我需要使用sklearn.cross_validation.train_test_split。有人可以解釋「分層」做什麼,這是做我正在做的事情的正確方法嗎?
您可以使用http://yandex.github.io/rep/utils.html#rep.utils.train_test_split_group實現所需的邏輯。第一個參數應該是一個person_ids列。 – Alleo