2012-03-13 64 views
1

我正在運行一個站點,並且我的集合中有4.5百萬個文檔。我需要爲任何文檔添加另一個字段,那麼在所有那些450萬中將會有10個不同的字符串。 該字符串將像「Apache 2.0使用E」。按序列號搜索會比搜索字符串更快嗎?

我需要找到所有的文件,例如,在這個字段中有「Apache 2.0 Using E」。那麼我應該用這個字符串搜索,還是應該爲所有字符串創建另一個集合,而不是按照字段的ID搜索我的4.5密耳集合?當然我會使用索引,但通過序列號搜索比搜索字符串更快?

謝謝。

回答

2

總體而言,搜索數字相等性可能會比字符串比較更快,也有助於搜索文檔的大小更小。很難說速度增加是否會很大,因爲性能會受到一些可能使字符串與整數比較變矮的因素的影響 - 例如文檔的大小增加如何影響RAM中的內容,對每個請求的字符串的另一個查詢比較慢。

索引將是太多更快。