1
我需要使用lucene測試全文索引和搜索,爲此我正在尋找各種類型(pdf,doc,txt, XML,JSON ...)。要測試全文搜索的數據庫
我已經試過維基百科的數據庫,但那些給我的只有一個xml文件。
任何人都可以建議我在哪裏找到這樣的數據庫?
我需要使用lucene測試全文索引和搜索,爲此我正在尋找各種類型(pdf,doc,txt, XML,JSON ...)。要測試全文搜索的數據庫
我已經試過維基百科的數據庫,但那些給我的只有一個xml文件。
任何人都可以建議我在哪裏找到這樣的數據庫?
您可以嘗試使用Full-Text Search with InnoDB。雖然使用http://dumps.wikimedia.org/會更好。
InnoDB的全文搜索,我認爲不適合我的目的,因爲我需要物理文件。我會在另一個環節中採取行動。感謝您的幫助 – masm
不客氣! –