有沒有人知道有哪些好的資源可以下載實例數據用於實驗統計和機器學習技術,如決策樹等?Web上有沒有可用於數據挖掘的有用數據集?
目前我正在學習機器學習技術,這對我有很多幫助,讓我有真正的數據來評估各種工具的準確性。
如果有人知道任何好資源(可能是csv,xls文件或任何其他格式),我會非常感謝您的建議。
有沒有人知道有哪些好的資源可以下載實例數據用於實驗統計和機器學習技術,如決策樹等?Web上有沒有可用於數據挖掘的有用數據集?
目前我正在學習機器學習技術,這對我有很多幫助,讓我有真正的數據來評估各種工具的準確性。
如果有人知道任何好資源(可能是csv,xls文件或任何其他格式),我會非常感謝您的建議。
UCI Machine Learning Archive和KDD Cup的過去數據集可能是最廣爲人知的這種用於一般數據挖掘的檔案。更具體的來源的一個例子是UCR Time Series Classification/Clustering Page。
這裏的an article from DataWrangling.com列出了數百個數據集。
在Kaggle你可以找到一些比賽並下載相關的數據集。
有一個系統可以實時評分您的解決方案,您將在「現場排行榜」上看到自己的位置。
這是研究機器學習技術的好方法,因爲選擇「知識」競賽可以將您的解決方案與其他參與者進行比較,並討論各種方法的優缺點。
試試我的博客,牛皮紙信息,在這裏我有幾個註釋書目策數據集和數據源:
http://velluminformation.com/2014/03/05/big-data-public-databases-an-annotated-bibliography/。
我有一個可用的各種數據源的註釋參考書目。我還在這裏得到了有關健康數據的註釋參考書目:
http://velluminformation.com/2012/05/19/free-online-public-data-sources-an-annotated-bibliography/。
明顯的披露,這是我的博客,所以還有其他技術性的東西。