我創建了一個數據幀DF在那裏我有一個具有以下值的列:蟒蛇熊貓部分字符串匹配
category
20150115_Holiday_HK_Misc
20150115_Holiday_SG_Misc
20140116_DE_ProductFocus
20140116_UK_ProductFocus
我要創建3分新列
category | A | B | C
20150115_Holiday_HK_Misc 20150115_Holiday_Misc HK Holiday_Misc
20150115_Holiday_SG_Misc 20150115_Holiday_Misc SG Holiday_Misc
20140116_DE_ProductFocus 20140116_ProductFocus DE ProductFocus
20140116_UK_ProductFocus 20140116_ProductFocus UK ProductFocus
在A列,我想取出「_HK」 - 我想我需要手動編碼這個,但這很好,我有所有國家代碼的列表
在B列中,它是非常國家代碼
列C,列A沒有日期在開始
我想這樣的事情,但沒有得到很遠。
df['B'] = np.where([df['category'].str.contains("HK")==True], 'HK', 'Not Specified')
謝謝
我在考慮一些字符串方法,如'.split()'例如 – AsheKetchum
除非你的字符串不是所有的結構以同樣的方式,所以它不會讓你在什麼地方你想成爲。 – AsheKetchum