之間的關係,考慮下面的數據幀:找到一個對一個,一到多,多到一列
first_name last_name
1 Al Smith
2 Al Jones
3 Jeff Thompson
4 Scott Thompson
5 Terry Dactil
6 Pete Zah
data <- data.frame(first_name=c("Al","Al","Jeff","Scott","Terry","Pete"),
last_name=c("Smith","Jones","Thompson","Thompson","Dactil","Zah"))
在這個數據幀中,有三種方式FIRST_NAME正在有關姓氏:
- 一對一(即,存在如first_name 和last_name之間的獨特關係)
- 一對多(即,一個如first_name點被用於多個 last_name的值)
- 多對一(即多個FIRST_NAME值指向 一個姓氏)
我希望能夠各自的三種情況,並將其輸出到快速確定數據幀。因此,得出的數據幀將是:
一對一
first_name last_name
1 Terry Dactil
2 Pete Zah
一對多
first_name last_name
1 Al Smith
2 Al Jones
多對一
first_name last_name
1 Jeff Thompson
2 Scott Thompson
我想內做到這一點dplyr軟件包。
你想'duplicateated()'函數 –
[這裏](http://www.cookbook-r.com/Manipulating_data/Finding_and_removing_duplicate_records/)是一些使用'duplicated()'的例子代碼,但我認爲它會如果你能給我們一些具體的東西,請冷靜一下,@RichardScriven。我並不是想解決這個問題。 TY。 –