我存儲了大量的Twitter數據,並且想要一次檢索大約500k個數據處理記錄。我有一個包含基本的鳴叫數據TwitterTweet蒙戈文件,並嘗試按如下方式進行檢索:在Mongo映射器中高效檢索大數據集?
weekly_tweets = TwitterTweet.all(:created_at.gt => 1.week.ago, :fields => [:created_at, :text, :from_user])
麻煩的是,這佔用的時間和內存有很多 - 有什麼辦法,使這更可擴展和高效。我曾想過使用map reduce,但它看起來非常複雜,我想做的事情 - 文本處理和推文上的正則表達式。
爲什麼不是更多,更小的電話?使用跳過和限制,一次取1000個。 – 2011-01-28 19:59:27