h2.each {|k, v|
@count += 1
puts @count
sq.each do |word|
if Wordsdoc.find_by_docid(k).tf.include?(word)
sum += Wordsdoc.find_by_docid(k).tf[word] * @s[word]
end
end
rec_hash[k] = sum
sum = 0
}
H2下面的代碼 - >是包含文檔ID的散列,散列包含比這些 Wordsdoc 1000更多 - >是我的數據庫中的模型/表格... sq - >是一個包含大約10個單詞的散列
我在做什麼是我要通過每個文檔ID然後每個單詞sq如果單詞存在(Wordsdoc.find_by_docid(k).tf.include?(單詞),我在Wordsdoc表中查找,這裏tf是{word => value}的散列表
如果確實如此,我得到這個詞的價值Wordsdoc並且與詞的@s價值倍數它,這也是{字=>值}
這似乎是一個哈希運行非常慢。每秒處理一個文件。有沒有辦法更快地處理這個問題?
非常感謝您的幫助!