2017-03-16 24 views
0

出於好奇,這更多的是一個問題。我在sklearn load_digits數據集中看到2個不同的2D數組 - 圖像和數據(http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html),並想知道我是否可以將它們交替使用以進行訓練。我問,因爲我能夠用圖像而不是數據訓練神經網絡,並看到它收斂到大約0.5%的訓練錯誤和8%的驗證錯誤與80-20分裂。如果是這樣,兩者之間的特徵有什麼區別?sklearn load_digits數據集中的圖像和數據之間的區別

除了您可以使用圖像數據集進行可視化之外,文檔中沒有提及太多關於這兩者的內容。

回答

1

考慮一下:

from sklearn.datasets import load_digits 
digits = load_digits() 

在功能項,有digits.datadigits.images之間沒有差異。兩者都包含一些8 * 8圖像的像素值。第一個是(1797,64)numpy.ndarray,而第二個是(1797,8,8)numpy.ndarray。唯一的區別是digits.images[i]digits.data[i]的8 * 8重塑,它更適合可視化。

相關問題