2
我有一個柱(「位置」)數據幀一個具有大約由逗號分隔的城市和州信息。有些值是無。熊貓:使用適用於列分成2
我寫了一個函數將數據分成城市和國家,並清理了一點:
def split_data(x):
if x:
s = x.split(',')
city = s[0].lstrip().rstrip()
state = s[1].lstrip().rstrip()
else:
city = None
state = None
return city, state
我有困難的時候搞清楚如何從這個函數創建2個單獨的列。 如果我使用以下命令:
df['location_info'] = df['location'].apply(split_data)
它創建了一個元組進入「LOCATION_INFO」列。
什麼是數據幀創建2個新列的最佳途徑 - 一個叫做「城市」,另一個叫「國家」?
偉大的答案!不幸的是,我簡化了這個例子的功能,現在我不能推斷你的答案,我真正的問題。抱歉。其實,我有我使用另一個分裂(位置格式爲:高中在市,州),我只需要在城市和國家,所以我使用一個額外的分裂(「IN」)。謝謝。 –
好,然後用你的函數'回報pd.Series([城市,州],指數= [ '城市', '國家'])'。 – jezrael