我有一個Azure表存儲解決方案,每個客戶(分區鍵)最多有幾個「行」。如何在Azure表格存儲中進行自由文本搜索?
我該如何做最好的閃電般的免費文本搜索?
由於數據的性質,我無法進行空洞詞搜索(例如搜索「zur」應該匹配「Azure」)。
我有一個Azure表存儲解決方案,每個客戶(分區鍵)最多有幾個「行」。如何在Azure表格存儲中進行自由文本搜索?
我該如何做最好的閃電般的免費文本搜索?
由於數據的性質,我無法進行空洞詞搜索(例如搜索「zur」應該匹配「Azure」)。
就看準了這一點,其可以幫助你:Azure Library for Lucene
目前沒有開箱即用的解決方案。也許全文搜索功能將在PDC10上公佈。
因此,目前您需要推出自己的文本索引解決方案。我這樣做的方式是通過在一個輔助角色上構建一個Lucene.net索引。然後,我使用WCF在該輔助角色上打開一個提供搜索服務的tcp端口。任何Web角色都可以使用該服務。這工作非常好,並提供了一個非常快速的搜索服務。
有由史蒂夫·馬克思一PDC09視頻,讓更多的信息:http://www.microsoftpdc.com/2009/SVC16
我們在生產中使用我們的網站如下:我們經營託管的Solr (基於lucene)http://websolr.com上的實例,並使用當前處於測試階段的新azure分佈式緩存功能來緩存結果。這給了我們在運行websolr.com的Amazon數據中心和Azure Datacenter之間的初始搜索請求最遲200毫秒的延遲,並且所有緩存搜索的平均延遲時間爲6-10毫秒。我們還會記錄常見的搜索文本片段,並嘗試在緩存中保持新鮮。