1
我有一個名爲'emails'的文件夾,其中有兩個子文件夾,它們以對應於文件分類的標籤命名(垃圾郵件或不發垃圾郵件,都是.txt文件)。這兩個子文件夾中有3000個文件。使用load_files:scikit-learn中的load_files不加載目錄中的所有文件
data = load_files('emails', shuffle='False')
print len(data)
print len(data.target)
這將打印'5',然後'3000'。如果發現3000個分類標籤,數據長度如何才能達到5?