2016-11-05 58 views
1

我有一個簡單data.frame抑制重複值的列在data.frame r中

mydf <- read.csv("mydf.csv") 
mydf 

         SOC  Preferred.Term  Serious  Non.Serious 
      cardiac disorders    dizziness    0     0 
      cardiac disorders dizziness postural    0     1 
      cardiac disorders   palpitations    0     0 
      cardiac disorders    dyspnoea    0     1 
      cardiac disorders  oedema peripheral    0     0 
       eye disorders lacrimation increased    0     3 
       eye disorders    eye pain    0     0 
       eye disorders    mydriasis    0     0 
       eye disorders  vision blurred    0     0 
       eye disorders  visual impairment    0     1 
       oral disorders   dental caries    0     0 
       oral disorders  tooth fracture    0     0 

你可以看到,該列標題SOC具有重複數次。 我想把它作爲一個表格,我只在SOC列中顯示任何唯一術語的第一個實例。 換句話說,我想表看起來像這樣:

      SOC  Preferred.Term  Serious  Non.Serious 
      cardiac disorders    dizziness    0     0 
           dizziness postural    0     1 
             palpitations    0     0 
              dyspnoea    0     1 
           oedema peripheral    0     0 
       eye disorders lacrimation increased    0     3 
              eye pain    0     0 
             mydriasis    0     0 
            vision blurred    0     0 
           visual impairment    0     1 
       oral disorders   dental caries    0     0 
            tooth fracture    0     0 

有一個簡單/快速的方法來改變我的data.frame除去在第一列中的重複?

或者,R中是否有某種類型的演示文件包會生成一個表,以消除第一列中的重複項?

謝謝你的任何建議。

回答

2

是假設變量SOC進行排序,是階級性的一個簡單的方法:

mydf$SOC[duplicated(mydf$SOC)] <- "" 
+0

這真棒。謝謝! – user36476