2012-08-07 53 views
1

我搜索了Google和各種大型XML文件的論壇,但除了1.0 GB的DBLP和我的需求太大以外,還沒有發現任何東西。我需要30-50 MB,100-300 MB和500 MB之類的套件。有人知道嗎?用於測試的XML數據

p.s.不要提出數據生成器,因爲我需要真實數據才能用於有意義的查詢測試。

+2

http://en.wikipedia.org/wiki/Wikipedia:Database_download? – porges 2012-08-07 08:49:02

+1

究竟需要什麼?如果你正在編寫一個商業應用程序,你需要擁有應用程序特定的數據,而不是來自互聯網某處的任意數據。因此,如果你在網上找到任何XML文件,我看不出有什麼理由讓你無法實現自己的數據生成器......? – 2012-08-07 08:50:17

回答

2

最後我找到了很好的數據集。它們在: http://dumps.wikimedia.org/mirrors.html 這些是來自各種wiki的數據集,包括維基百科。人們可以找到從10MB到500-600MB的各種大小的數據集。

1

您可以將整個openstreetmap database下載爲250GB xml。這應該足夠大來進行測試。

+0

我需要我在問題中提到的尺寸。請仔細閱讀。 – 2012-08-08 13:49:42

+0

爲什麼是你的問題的標題*大* XML數據集呢? – hroptatyr 2012-08-08 14:37:47

+1

這些尺寸並不是很大。但是您也可以下載openstreetmap文件來查找較小的區域。 (例如17M壓縮的盧森堡,或者215M壓縮的澳大利亞(?),...) – BeniBela 2012-08-08 14:40:07

0

您始終可以使用XSLT生成任意大小的XML文檔。

這裏是一個着名的XML文檔實例(44GB,壓縮3.8GB) - CityGml file

+0

我不需要這麼大的文件。只是小的。 – 2012-08-08 13:50:14

+1

爲什麼是你的問題的標題**然後是大** XML數據集? – hroptatyr 2012-08-08 14:37:28

+0

因爲500 MB不小。 – 2012-08-08 15:58:26

相關問題