我需要一些關於如何在R中啓動實現問題的幫助。我有一個數據框,其中的行由變量「id」分組。對於每個'id'我只想保留一行。但是,我有許多標準來指定要刪除哪些行。R根據各種標準刪除行
這些都是我的一些標準:
- 我想保持它有「文本」 = NA(可能有幾個這樣的行)各組「身份證」中的一個隨機行;而且我也想保留該行的所有列,對於所有以下標準也是如此。
- 如果一個組中的所有行都有'text'== NA,那麼我想保留一個隨機行,它具有變量'check'== T(可能有幾個這樣的行)
- 如果所有行都在一個組具有'文本'== NA和'檢查'== F,那麼我想保留具有符合條件的變量'newtext'的行(grepl(「None」,df $ newtext))
我也可以提供一個數據集,如果這使得它更清晰。但是,我最重要的問題是,我不知道如何按照有序數量的條件來實現這種刪除行的邏輯。 這將是很好,如果任何人都可以告訴我如何實現這樣的代碼。
謝謝!
這將是一個例子的數據集:
df <- data.frame(id = c(1,1,1,2,2,2,3,3,3),
text=c("asd",NA,"asd",NA,NA,NA,NA,NA,NA),
check = c(T,F,T,T,T,F,F,F,F),
newtext =
c("as","as","as","das","das","None","qwe","qwe2","None"),
othervars = c(1,2,3,45,5,6,6,7,1))
作爲輸出,我想保持下面的行: 行1或3 第4行或5 行7或8個 列othervars應保留以及我稍後需要這些信息。
希望這可以讓它更清晰一些。
如果您可以提供數據集或數據集的相關部分,那將會很好。這將爲我們節省大量時間來編寫任何可以在我們衆多條件下實現的代碼。 –
我添加了一個最小的數據集。希望這可以幫助! – Rnewbie