我想要通過多個變量對數據集進行分組,而不是對這些組進行編號。當我只用一個變量對group_indices使用dplyr進行分組時,我可以使用id組。 但我想通過對至少一個變量集中的至少一個賦值相同的值來對案例進行分組,然後確定屬於的組案例。如何在R中做到這一點?在R中至少有三個共同變量的例子
我有以下數據集
NPI name adress phone
1 1 1 1
2 1 1 1
3 2 2 2
4 2 3 3
5 3 4 4
6 3 4 5
7 4 5 6
8 5 6 6
9 6 7 7
10 7 8 8
11 1 9 9
我想,當他們有共同的三個I上市(姓名,ADRESS,PHONENUMBER)中的至少一個變量來進行分組的情況。 對於彼此具有最多共同點的案例,應該將它們分組在共同點最少的案例中。 所以我想創建一個分組變量,如果它們在同一個組中,它將給出相同的值。 你可以假設名稱>地址的層次>手機
NPI name adress phone org
1 1 1 1 1
2 1 1 1 1
3 2 2 2 2
4 2 3 3 2
5 3 4 4 3
6 3 4 5 3
7 4 5 6 4
8 5 6 6 4
9 6 7 7 5
10 7 8 8 6
11 1 9 9 1
在我的真實數據集,我沒有數字,但姓名,實際地址和電話號碼。所以我正在使用的所有變量都是字符串變量。
爲什麼是最後一個值1 – akrun
因爲它的股票名稱與前兩種情況 –
我們是否可以假設一個層次(看起來暗示)。如:姓名>地址>組織? – jacobsg