2017-09-29 150 views
0

假設有一個數據集如下:計算權重的相似度得分

dataA: { 
    attribute1: x, 
    attribute2: y, 
    attribute3: z 
} 

我想要計算類似的結構化數據之間的相關性(如:dataA, dataB, dataC ...

我有一個相似性度量每個數據集的每個屬性。 (如:的xattribute1其它值的相似性爲0.11,的yattribute2其它值相似度0.22,具有的attribute3其它值的z相似度0.33)

我要去呈現的相關性得分其中,權重爲每個屬性定義的加權平均的方法(如:重attribute1w1等):

Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) }/{w1 + w2 + w3} 

如果我打算做一個實驗,找到最優權重,我該怎麼辦它?

UPDATE:

我可以做一個試驗,以檢查每個屬性值的概率要更改,然後使用該值不知何故?

回答