我有這個簡單的數據框:如何刪除Pandas中列中特殊字符之前的部分字符串?
In [101]: df = pd.DataFrame({'a':[1,2,3],'b':['ciao','hotel',"l'hotel"]})
In [102]: df
Out[102]:
a b
0 1 ciao
1 2 hotel
2 3 l'hotel
這裏的目標是消除未來的字符串'
撇號的一部分,使DF:
a b
0 1 ciao
1 2 hotel
2 3 hotel
到目前爲止,我試圖拆分字符串與sep=("'")
並只獲得第二個元素,但是失敗了,因爲我有不同長度的字符串(因此列表):
df['c'] = df['b'].apply(lambda x: x.split("'")[1])
應該可以使用正則表達式。 https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.extract.html – 10101010