2016-01-23 54 views
-1

加載數據集,我按照this tutorial的例子。從我的本地文件夾

不必加載數據集如下:

dataset = datasets.fetch_mldata("MNIST Original") 

如何從我的「本地」文件夾中加載我的數據集?爲了在示例中使用數據,是否有特定的數據結構?

謝謝。

回答

0

我認爲答案是在頁面已經找到您所提供

我們做對13號線的fetch_mldata功能下載 從mldata.org庫的原始數據集MNIST通話。

實際的數據集大約是55MB,因此可能需要幾秒鐘的時間 下載。然而,一旦數據集下載它在本地緩存 你的機器上,所以你將不必再下載

它會一次加載數據集,然後使用本地緩存副本。

來源:http://www.pyimagesearch.com/2014/09/22/getting-started-deep-learning-python/

編輯:有一個關於http://scikit-learn.org/stable/datasets/mldata.html一些信息,例如,

的MNIST數據庫包含總計的手寫 數字尺寸28x28像素,從0標記70000個實施例9

第一下載後,該數據集是緩存在由data_home關鍵字參數指定的路徑 本地緩存中,該路徑默認爲 〜/ scikit_learn_data/

+0

感謝您的答覆。我的意思是說我的「自己」的數據集,而不是MNIST。這更清楚嗎?謝謝 – Simplicity

+0

然後使用data_home關鍵字參數。 – zebralove79

0

用於爲data_home參數fetch_mldata狀態的文檔:

指定其他下載和緩存文件夾中的數據集。默認情況下,所有scikit學習數據存儲在「〜/ scikit_learn_data」子文件夾。

它應該下載那裏.mat文件,據推測。您可以在this question中找到如何打開.mat文件。

相關問題