2017-06-17 92 views
0

我在df和20列中有大約200.000行,一列包含了站的名稱。它看起來像這樣:解析python熊貓的列值

00001 OPPT YY G 
00002 LIMO DA G 
000016 KAPAL VS G 
0000663 TAPS VS G 
... 

從列值中只取數字的最佳方法是什麼? 所需的輸出:如果你的數據幀是DF和你的第一列包含此數據則如:

(df.T).ix[0] 

我希望這將

00001 
00001 
000016 
0000663 

感謝

回答

1

假設Col1是你列的空間

df 
Out: 
       Col1 
0 00001 OPPT YY G 
1 00002 LIMO DA G 
2 000016 KAPAL VS G 
3 0000663 TAPS VS G 

拆分和採取的第一個元素:

df['Col1'].str.split().str[0] 
Out: 
0  00001 
1  00002 
2  000016 
3 0000663 
Name: Col1, dtype: object 
+0

好,有時也可以是不同的順序,第一個字,然後位數,是我不好。 – jovicbg

+0

@jovicbg我認爲這需要正則表達式,我不是很擅長。你能不接受答案,所以人們不會考慮解決這個問題,並看看這個問題。順便提一下,編輯問題可能會更好。 – ayhan

0

,因此您可以使用此功能幫你。