我正在嘗試從熊貓數據框中進行訓練和測試。當我運行:Sklearn StratifiedShuffleSplit with pandas
sss = StratifiedShuffleSplit(df['event'], n_iter=3, test_size=0.2)
我得到的錯誤:
ValueError: The least populated class in y has only 1 member, which is too few. The minimum number of labels for any class cannot be less than 2.
然而,這不是因爲我在運行時的情況:
df.event.value_counts()
我得到:
irrelevant 5030
event 394
有什麼想法可能會導致這個問題?
無法重現您的警告。出於好奇,什麼是「len(df)」? –
5424.我只是嘗試了一個完全不同的csv,它工作正常,即時通訊不知道這是什麼引起的問題這個df。 – GNMO11
在CSV中看起來像一個空行導致它 – GNMO11