如何將這樣的列分隔開,其中數據具有分隔符但其餘部分不是並且它具有一些不相等的字符串?用不均勻/不等分的字符串和無分隔符分隔列
輸入: ID
142 TM500A2013PISA8/22/17BG
143 TM500CAGE2012QUDO8 /一千七百二十○分之二十二+
輸出:
類網站菜地一年種日期部分 142 TM 500 A 2013 PISA 8/22/17 BG 143 TM 500 CAGE 2012 QUDO 17年8月22日20+
我捅了周圍的其他問題,並嘗試的東西,如果它是一個平等的字符串即可以工作:
>df <- avgmass %>% separate(id, c("site", "garden", "plot", "year",
"species", "sampledate", "portion"),sep=cumsum(c(2,3,3,4,4,5)))
但隨着情節的ID是A ,B或CAGE;日期有「/」 - 我不知道如何處理它。
由於我對R相對比較陌生,我試圖尋找更多關於如何使用sep參數的細節,但無濟於事......感謝您的幫助。
如果是固定長度的不,嘗試用'?extract' – akrun
你能顯示預期的輸出 – akrun
我們不知道這些字母和數字的意思。分割領域的規則是什麼?爲什麼世界上的數據是這樣格式化的? – MrFlick