我搜索了Google和各種大型XML文件的論壇,但除了1.0 GB的DBLP和我的需求太大以外,還沒有發現任何東西。我需要30-50 MB,100-300 MB和500 MB之類的套件。有人知道嗎?用於測試的XML數據
p.s.不要提出數據生成器,因爲我需要真實數據才能用於有意義的查詢測試。
我搜索了Google和各種大型XML文件的論壇,但除了1.0 GB的DBLP和我的需求太大以外,還沒有發現任何東西。我需要30-50 MB,100-300 MB和500 MB之類的套件。有人知道嗎?用於測試的XML數據
p.s.不要提出數據生成器,因爲我需要真實數據才能用於有意義的查詢測試。
最後我找到了很好的數據集。它們在: http://dumps.wikimedia.org/mirrors.html 這些是來自各種wiki的數據集,包括維基百科。人們可以找到從10MB到500-600MB的各種大小的數據集。
您可以將整個openstreetmap database下載爲250GB xml。這應該足夠大來進行測試。
您始終可以使用XSLT生成任意大小的XML文檔。
這裏是一個着名的XML文檔實例(44GB,壓縮3.8GB) - CityGml file。
我不需要這麼大的文件。只是小的。 – 2012-08-08 13:50:14
爲什麼是你的問題的標題**然後是大** XML數據集? – hroptatyr 2012-08-08 14:37:28
因爲500 MB不小。 – 2012-08-08 15:58:26
http://en.wikipedia.org/wiki/Wikipedia:Database_download? – porges 2012-08-07 08:49:02
究竟需要什麼?如果你正在編寫一個商業應用程序,你需要擁有應用程序特定的數據,而不是來自互聯網某處的任意數據。因此,如果你在網上找到任何XML文件,我看不出有什麼理由讓你無法實現自己的數據生成器......? – 2012-08-07 08:50:17