我Cloudsearch指數目前是否可以使用AWS Cloudsearch配置令牌分隔符字符?
我的理解是,這(對two three
等搜索時,並也將包括在內,正確的,在結果)沒有返回結果one-two three
但它確實爲one two three
返回一個結果(正確)是因爲可搜索的詞組被分解爲它們的標記(詞),空白和標點符號充當分隔符。因此,one
和two
成爲單獨的標記,但one-two
不是有效的標記,因此未找到結果。從Cloudsearch docs:
在標記化,文本字段中的流被分成單獨的令牌使用在Unicode文本分割算法中定義的單詞斷規則可檢測的邊界。
那個Unicode文件is here。
我希望能夠搜索one-two three
並找到相關結果以及一些其他標點符號,如/
。是否可以使用Cloudsearch進行配置?
這是蹩腳的,你不應該改變你的語料庫以滿足AWS的限制。它不支持WordDelimiterFilterFactory嗎? – occasl 2015-04-08 22:28:08