3

我期待在PostgreSQL,SQLServer和Lucene中對全文搜索索引進行一些基準測試。用於全文搜索的示例數據庫

關於在哪裏可以找到一個好的大樣本數據庫來執行查詢的任何想法?

非常感謝。

+0

這個問題也可以在http://opendata.stackexchange.com/ – 2015-07-24 11:47:26

回答

2

我認爲偉大的來源將是維基百科的數據庫轉儲,因爲它們包含非常多的文本。它們可以在這裏找到:http://dumps.wikimedia.org/

你也可以嘗試使用usenet歸檔,但挑選目標語言更困難,所用語言的質量也更低。

+0

的主題。它也可能是STACKOVERFLOW的問題轉儲... :-) – 2011-02-24 10:54:36

相關問題