我在R中有一個data.frame,爲了簡單起見,它有一列,我想分開。它看起來像這樣:tidyr只分開前n個實例
V1
Value_is_the_best_one
This_is_the_prettiest_thing_I've_ever_seen
Here_is_the_next_example_of_what_I_want
我真正數據量非常大(數百萬行的),所以我想用tidyr的單獨的函數(因爲它是驚人的快)分離出開頭的幾個實例。我希望得到的結果是以下幾點:
V1 V2 V3 V4
Value is the best_one
This is the prettiest_thing_I've_ever_seen
Here is the next_example_of_what_I_want
正如你所看到的,分隔符是_
的V4列可以有分隔的不同的數字。我想保持V4(不放棄它),但不必擔心有多少東西在那裏。總是會有四列(即我的行沒有隻有V1-V3)。
這裏是我的出發tidyr命令我一直使用:
separate(df, V1, c("V1", "V2", "V3", "V4"), sep="_")
這擺脫V4的(和吐出的警告,這是不是最大的交易)。
你只需要'額外=「合併」分割的數量的另一種選擇'? – aosmith
@aosmith是的,謝謝。我讀了10次文檔,不知怎的,誤解了!請把它寫成答案! –