2017-10-05 52 views
0

我有處理正則表達式的困難。如何刪除熊貓的括號中的雙?

這是我正在處理的數據幀。 這是來自kaggle的數據 (url ='https://www.kaggle.com/c/pkdd-15-predict-taxi-service-trajectory-i') 我想要做的是將每行的[經度,緯度]分開並使用它的每個單位。

例如,對於每一行 長& LAT = [long0,lat0],[,],[,],[,] ,,,,,, [長N,LAT N] 或 長& LAT =
我想提取每個單元喜歡 長&緯度[0] = [long0,lat0] 或 長&緯度[0] = long0,lat0如果可能的話 我該如何處理呢?

我嘗試了其他一些方法。

df_concat['POLYLINE'][0].str.split(',')[0] 
df_concat['POLYLINE'][:3].apply(pd.Series) 

但是找不到如何去做。

回答

0

考慮這個虛擬DF

long&lat 
0 [100, 50] 
1 [200, 150] 

使用

df['long'] = df['long&lat'].apply(lambda x: x[0]) 
df['lat'] = df['long&lat'].apply(lambda x: x[1]) 

或者乾脆

df[['long', 'lat']]=df['long&lat'].apply(pd.Series) 

你得到

long&lat long lat 
0 [100, 50] 100  50 
1 [200, 150] 200  150 
你可以得到lat和長值210