3

我在我的培訓數據庫 - 用戶,企業和評論中有3個集合。我想使用斜率1來預測其他項目的評分,但我不確定如何最好地從企業間收集MongoDB的評分差異。計算斜率MongoDB中的一個差異

我在Review集合中擁有200,000個評分,並且我只想比較具有共享類別的商家。因此,我發現所有在這些類別下都有企業評論的用戶。

business = businesses.find({'categories':{"$in" : business_categories}},{'business_id'}) 

for biz in all_businesses: 
    biz_list.append(biz['business_id']) 
reviews = training_reviews.find({'business_id':{"$in" : biz_list}}) 

for review in reviews: 
    review_list.append(review['user_id']) 

available_users = users.find({'user_id':{"$in": review_list}}) 

一旦我有我的用戶,我需要設置所有的評級矩陣,所以我可以計算出各企業之間的差別。我的最小尺寸矩陣將爲10k x 10k,並且因爲對於每個推薦我都會有幾個類別,所以我將不得不爲每個推薦重做它。

有沒有一種有效的方法來做到這一點在python中?爲所有的企業出口評級矩陣,然後通過評級來預測評級會更好嗎?

謝謝。

回答