我的熊貓數據框列center
如下所示:比賽,直到第一次出現只有
In [6]: df.center.head()
Out[6]:
0 /Users/sachin/uniwork/IMG/center_2017_09_17_20...
1 /Users/sachin/uniwork/IMG/center_2017_09_17_20...
2 /Users/sachin/uniwork/IMG/center_2017_09_17_20...
3 /Users/sachin/uniwork/IMG/center_2017_09_17_20...
4 /Users/sachin/uniwork/IMG/center_2017_09_17_20...
Name: center, dtype: object
我希望IMG
之前擺脫所有的垃圾。但是,當我執行以下字符串替換時,它會在IMG文件夾之前和之後替換圍繞IMG的所有內容。
In [7]: df.head().center.str.replace(r'[^IMG]+?','')
Out[7]:
0 IMG
1 IMG
2 IMG
3 IMG
4 IMG
Name: center, dtype: object
我認爲把?
將停止搜索超出IMG的第一次出現,但是這肯定並非如此,因爲上面看到的。
做上述正則表達式的正確方法是什麼?
''/ IMG'+ df.center.str.rsplit('/ IMG',1).str [1]'也許? – Zero
我使用str.split,但不能訪問[1],即我使用'str [1]'。謝謝你,先生。 – Dark