2015-02-09 35 views
0

我Cloudsearch指數目前是否可以使用AWS Cloudsearch配置令牌分隔符字符?

我的理解是,這(對two three等搜索時,並也將包括在內,正確的,在結果)沒有返回結果one-two three但它確實爲one two three返回一個結果(正確)是因爲可搜索的詞組被分解爲它們的標記(詞),空白和標點符號充當分隔符。因此,onetwo成爲單獨的標記,但one-two不是有效的標記,因此未找到結果。從Cloudsearch docs

在標記化,文本字段中的流被分成單獨的令牌使用在Unicode文本分割算法中定義的單詞斷規則可檢測的邊界。

那個Unicode文件is here

我希望能夠搜索one-two three並找到相關結果以及一些其他標點符號,如/。是否可以使用Cloudsearch進行配置?

回答

0

我剛剛意識到一個簡單的解決方案,這工作正常,雖然它在技術上不能回答我的問題。我只是需要預先處理我的查詢字符串,然後將它們發送到雲搜索,方法是將-/或任何字符替換爲單個空格。

那樣,one-two three實際上執行搜索one two three,返回正確的結果。

+0

這是蹩腳的,你不應該改變你的語料庫以滿足AWS的限制。它不支持WordDelimiterFilterFactory嗎? – occasl 2015-04-08 22:28:08

相關問題