2015-12-01 117 views
2

輸入與約束驗證:如何使用交叉scikit學習

  • 我有其中每行是表示人的示例圖像的陣列X
  • 另一個陣列y爲它們的標籤,其中標籤是1和7
  • ids最後陣列,其中ids[i]表示第i人的在X[i]的ID之間的整數。 (同一人具有相同的ID,並有可能是同一人的不同的圖像。)

是否有可能劃分Xy,使同一人不進入這兩個試驗和訓練集?我想我需要使用sklearn.cross_validation.train_test_split。有人可以解釋「分層」做什麼,這是做我正在做的事情的正確方法嗎?

+1

您可以使用http://yandex.github.io/rep/utils.html#rep.utils.train_test_split_group實現所需的邏輯。第一個參數應該是一個person_ids列。 – Alleo

回答