我有一個存儲在mongodb數據庫中的希臘語推文的大型數據庫。MongoDB文本索引不受支持的語言
(3M Tweets大約30GB的存儲空間)。
我在文本上創建了一個文本索引,並在時間戳字段上創建了一個有序索引。但是,我發現MongoDB不支持希臘語文本索引,因此希臘語文本查詢相對較慢。我如何面對這個問題,併爲希臘文件創建一個倒排索引?
我有一個存儲在mongodb數據庫中的希臘語推文的大型數據庫。MongoDB文本索引不受支持的語言
(3M Tweets大約30GB的存儲空間)。
我在文本上創建了一個文本索引,並在時間戳字段上創建了一個有序索引。但是,我發現MongoDB不支持希臘語文本索引,因此希臘語文本查詢相對較慢。我如何面對這個問題,併爲希臘文件創建一個倒排索引?
使用solr構建您的索引而不是mongodb,它具有很多支持多語言搜索的功能。
我剛剛發現,如果我根據文檔選擇語言,則不會創建使用標記化的簡單倒排索引。
http://docs.mongodb.org/manual/reference/text-search-languages/#text-search-languages
如果指定「無」的語言值,然後將文本搜索使用 沒有停止詞列表簡單的符號化,並沒有制止
好[文章](HTTP ://ngsiolei.blogspot.in/2010/11/basic-inverted-index-in-mongodb.html) –