0
假設有一個數據集如下:計算權重的相似度得分
dataA: {
attribute1: x,
attribute2: y,
attribute3: z
}
我想要計算類似的結構化數據之間的相關性(如:dataA, dataB, dataC ...
)
我有一個相似性度量每個數據集的每個屬性。 (如:的x
與attribute1
其它值的相似性爲0.11,的y
與attribute2
其它值相似度0.22,具有的attribute3
其它值的z
相似度0.33)
我要去呈現的相關性得分其中,權重爲每個屬性定義的加權平均的方法(如:重attribute1
是w1
等):
Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) }/{w1 + w2 + w3}
如果我打算做一個實驗,找到最優權重,我該怎麼辦它?
UPDATE:
我可以做一個試驗,以檢查每個屬性值的概率要更改,然後使用該值不知何故?