我們面對不同的搜索引擎爲我們的研究 檔案並具有瀏覽Xapian的歐米茄文檔,我們 決定自歐米茄選項似乎是一個 嘗試一下適當的解決方案和幾個有趣的搜索選搜索 - 使用通配符或正則表達式
我們在Linux服務器上安裝了Xapian-Omega(Deb 7)並測試了成功的設置 。然而,我們不確定 如何使用Xapian-Omega,或者甚至可以使用Wild Cards或常規 表達式。
我們讀到Xapian必須啓用Wild Card選項 「QueryParser flags」 有人可以澄清一下嗎? 即。用一個或兩個示例解釋或指示一個頁面。
但我們並沒有看到關於與歐米茄 CGI雖然後者運行良好的例子多的信息,外卡選項(如*爲廣大外卡?爲單個字符), 似乎並不 就到按預期工作,默認情況下它們是 有用,即使干擾和子字符串等可能是有用的。
如:這將是有趣的,能夠使用標準的簡單 野生字符的搜索具有一定的精確度,例如: 醫藥醫療藥物 或軍醫*?對於單個字符
Regexp可以用歐米茄識別嗎? 例如:sep [ae] r [ae] te(\ w +)? (dev郵件列表)關於 這一建議 或搜索結構化的格式,如電子郵件或信用卡 號或研究論文等
在從奧利貝茨記不久前一定的公式類型是到grep指數但這會讓 擊敗歐米茄的RAD優勢。
使用歐米茄通配符或正 表達式搜索的任何示例將是非常讚賞...甚至 ,其中有關這個主題的信息很好地舉例說明了如何使用來開發先進的搜索 呈現 頁面指示Xapian本身是最受歡迎的(也許是PHP或Python)。
(我們不關心有關索引大小的尺寸或 時間指數最終 大幅增加存檔的那一刻)