我有50件產品。對於每種產品,我想使用相似性度量標識以下四種相關產品。在Python中比較排名列表
- 1相關的最
- 2部分相關
- 1不相關
我想比較我的模型產生的排名列表(預測)由指定的排名列表領域專家(地面實況)。
通過閱讀,我發現我可以使用基於等級相關的方法,比如Kendall Tau/Spearmen來比較排名列表。但是,我不確定這些方法是否合適,因爲我的樣本數量很少。(4)。如果我錯了,請糾正我。
另一種方法是使用Jaccard相似度(設定交叉點)來量化兩個排序列表之間的相似度。然後,我可以繪製來自setbased_list (見下文)的直方圖。
for index, row in evaluate.iterrows():
d= row['Id']
y_pred = [3,2,1,0]
y_true = [row['A'],row['B'],row['C'],row['D']]
sim = jaccard_similarity_score(y_true, y_pred)
setbased_list.append(sim)
是我的方法上面正確的問題呢?
如果我想考慮列表中元素的位置(基於權重),我可以使用哪些其他方法?
爲什麼你確定一個產品是不相關的? – Rojan
這就像'控制'數據,以確保用戶相應的排名.. – kitchenprinzessin