2016-03-30 55 views
0

我想要在熊貓中分割一列文本。基於多個字符串在熊貓中分列一列

此列包含單詞'Alpha','Beta'。 我需要在這些單詞之後拆分這一列,這些單詞以及之前的所有內容都需要在一列中進行分割,並且之後的所有內容都將放在一個新列中。

我嘗試這樣做:

split_df = df.str.split('ALPHA ').apply(pd.Series) 

但後來我失去了一切,你可以通過split正則表達式r'Alpha|Beta' ALPHA

回答

1

IIUC之前 - 這意味着AlphaBeta

print df 
      text 
0 aaa Alpha bbb 
1 ddd Alpha ccc 
2 uuu Beta vvv 

split_df = df['text'].str.split(r'Alpha|Beta').apply(pd.Series) 
split_df.columns = ['before','after'] 
print split_df 
    before after 
0 aaa  bbb 
1 ddd  ccc 
2 uuu  vvv 
相關問題