我有一個數據幀如下:各執定界符從次串固定數量的端
df = data.frame(a = 1:4, strings = c('ooss_bboo_foo','ee_bbbbee_fffee','aas_baa_ffaa_daa', 'iisss_bbbbii_ffffii_dii_mii'))
欲分割上_
,產生新的列(或新的數據幀,不真的很重要)。出現次數的數量可以與min(lengths(strsplit(df$strings, "_")))
和max(lengths(strsplit(df$strings, "_")))
所需的輸出進行估算:
X1 X2 X3
1 ooss bboo foo
2 ee bbbbee fffee
3 aas_baa ffaa daa
4 iisss_bbbbii_ffffii dii mii
我已經試過正則表達式的大量的已經和我很絕望已經...
'do.call( 'rbind',strsplit(as.character(DF $字符串),「_(= [AZ] + $)| _(= [ az] + _ [az] + $)',perl = TRUE))' – rawr