我有一個dataframe
,time
列和string
列。我想要subset
這個dataframe
- 在那裏我只保留其中string
列包含$
符號的行。
子集後,我要清理string
列,使其只包含characters
的$
符號之後,直到有一個space
或symbol
df <- data.frame("time"=c(1:10),
"string"=c("$ABCD test","test","test $EFG test",
"$500 test","$HI/ hello","test $JK/",
"testing/123","$MOO","$abc","123"))
我想最終的輸出是:
Time string
1 ABCD
3 EFG
4 500
5 HI
6 JK
8 MOO
9 abc
它只保留在字符串列中有$
的行,然後只保留之後的字符10個符號,並直至space
或symbol
我已經取得了一些成功sub
簡單地拉出string
,但一直沒能適用於該df
和其子集。謝謝你的幫助。
這真是太好了,謝謝。有一件事我在我沒有預見到的數據集上運行時遇到了 - 有些字符串實際上有多次出現'$ string' - 例如,一個值可能是$ ABCD test $ EBC和$ FB' - 這產生了一個值c(「ABCD」,「EBC」,「FB」)'。是否有可能只存儲第一次出現?謝謝! – newtoR
@newtoR使用這一行來獲得只有第一個出現'x < - i [grepl(「$」,i,fixed = TRUE)] [1]',作爲註釋添加到帖子中 – zx8754