我正試圖計算由entity_id,type_of_order,total_value描述的n個實體之間的相似度。 的數據的一個例子可能是這樣的: NR entity_id type_of_order total_value
1 1 A 10
2 1 B 90
3 1 C 70
4 2 B 20
5 2 C 40
6 3 A 10
7 3
我有2000行4000列的數據。我想要做的是將每行與其餘行進行比較,並查看它們在不同列/總列中的相似程度。 我所做的一切至今如下: for (i in 1:nrow(data))
{
for (j in (i+1):nrow(data))
{
mycount[[i,j]] = length(which(data[i,] != data[j,]))
}
我有一個陣列A和一個參考陣列B。 A的尺寸至少與B一樣大。例如 A = [2,100,300,793,1300,1500,1810,2400]
B = [4,305,789,1234,1890]
B實際上峯的一個信號在指定的時間的位置,和含有A在稍後的時間的峯的位置。但A中的一些元素實際上不是我想要的峯值(可能是由於噪音等原因),我想根據B找到A中的「真實」元素。 A中的'real'元素應該