早些時候,我的索引使用的是lucene分析器。我將它改爲微軟。現在指數的規模大大增加了。爲什麼尺寸增加很多。 ?附:附件。 Azure搜索 - 使用微軟英文分析器增加索引大小
0
A
回答
2
指數大小的差異預計。對於在文檔中每個單詞微軟儀產生的原詞和詞的基本形式,例如,如果你的文檔有運行字,Azure的搜索將指數兩個術語:運行和運行。請參閱我在下面的帖子中回答更多詳細信息:Azure Search: Searching for singular version of a word, but still include plural version in results
Lucene分析器詞幹什麼導致索引中的獨特術語更少。 您可以在這裏瞭解更多關於差異的信息:https://docs.microsoft.com/en-us/rest/api/searchservice/Language-support?redirectedfrom=MSDN
根據分析器/語言,對索引大小的影響將有所不同。您可以使用Analyze API測試您使用的分析儀的行爲:https://docs.microsoft.com/en-us/rest/api/searchservice/test-analyzer。
這就是說,你看到的差異超過了我的預期。請通過微軟的janusz.lembicz與我聯繫,討論您的場景的細節。
相關問題
- 1. Azure搜索 - 暱稱分析
- 2. Solr非英文索引和搜索
- 3. 錯誤的索引彈性搜索使用分析器
- 4. 使用FULLTEXT索引增強MySQL搜索
- 5. Azure搜索索引 - 搜索確切詞
- 6. 微軟搜索服務器沒有SharePoint
- 7. 微軟Word(2007) - 刪除內容後增加文件大小
- 8. Azure搜索或全文索引?
- 9. Azure的搜索索引文件,清除
- 10. 搜索引擎關鍵詞分析器
- 11. 使用Azure搜索,Azure SQL和Azure Blob存儲添加全文本搜索
- 12. 彈性搜索索引未被分析
- 13. 索引分配最大文件大小
- 14. 用英文搜索英文和日文
- 15. Azure搜索最小值最大值
- 16. 搜索引擎是否增加微格式的權重?
- 17. 解析XML文件從微軟的搜索引擎優化工具包
- 18. Azure搜索得分
- 19. OCAML增量搜索子字符大小
- 20. Azure搜索 - 語音分析儀問題
- 21. SOLR索引分項大小
- 22. 使用Azure搜索從Azure數據庫索引HTML內容
- 23. 搜索查詢分析器
- 24. 彈性搜索分析器
- 25. 彈性搜索分析器
- 26. Elasticsearch搜索分析器
- 27. PostgreSQL索引使用分析
- 28. Elasticsearch使用索引(分析器)只有
- 29. 微軟Powerpoint Python分析器
- 30. 將新文檔添加到Azure時出錯搜索索引