我對Apache Solr做了一些分析,它很適合從各種來源搜索數據。 我面臨的問題是如何標準化我的搜索語法並將搜索文本轉換爲Solr查詢。半自然語言使用Apache Solr進行搜索
我有三種類型的文件/數據庫表進行搜索 - 即客戶,行業和單位。搜索框中的第一個關鍵字應該是三個中的任意一個。在此之後,用戶可以定義一個固定的一套標準:
Metrics : 0 or many (ex, exposure, income, revenue, loan_amt etc)
Dimension : 0 or many (Geography, region, etc)
例子:
customer - Returns all customer data from customer core
customer income from Asia - Returns all customer income details who belongs to Asia
customer income revenue from Asia - Returns all customer income and revenue details who belongs to Asia
如何翻譯上面的自然語言搜索文本到Solr查詢? 我可以修復Solr中的文本語法,如 第一個關鍵字應該是客戶/行業/單位, 第二個關鍵值應該是一個或多個地區/地理位置 ,然後是度量值。
我不是在尋找谷歌喜歡搜索,但有限的搜索,用戶知道要搜索什麼。
感謝martin。你能建議一個好的Java API /示例誰可以幫助定義上下文無關語法。 – user3222372
也許這有助於:http://www.cs.columbia.edu/~zeph/software/JavaCFG/instructions.html –