2017-10-10 61 views
0

我已經繼承了一個正在生產的mediawiki服務器,該服務器已經使用大型數據集由python腳本自動生成頁面。這個特定的wiki上有大約200萬頁。我們注意到一些短語搜索沒有提出明顯應該有的結果。所以我們運行維護/ rebuildtextindex.php像mediawiki規定。現在搜索結果正確返回。問題在於單詞搜索很好,但短語不是。例如。不帶引號的「word1 word2」會在幾秒或更短的時間內返回結果,但在最終返回結果之前,引號需要幾分鐘的時間纔會顯示「等待[域] ...」的瀏覽器。Mediawiki正在運行rebuildtextindex.php使詞組搜索花費了幾分鐘的時間

我試過尋找這個腳本的問題,mediawiki的版本是1.24,所以我試圖運行腳本,並且沒有刪除搜索索引表。兩者都帶來相同的結果。

我是mediawiki的新手,擁有足夠的PHP知識來理解基本的PHP,我可以用SQL,但是看不到我失蹤的東西。我怎樣才能讓詞組搜索更快?

回答

0

本機MediaWiki使用MySQL全文索引,它並非真正意義上爲數十億字(假設每頁千字"word1 word2"將轉換爲JOIN與10^18行...)。您應該使用爲搜索開發的技術(例如通過CirrusSearch擴展名的ElasticSearch)。