我有一個包含多個單詞的字符串系列。我想以矢量化的方式提取每行每個單詞的第一個字符。從列表系列熊貓中提取第一個字符
到目前爲止,我已經能夠將單詞分成列表,但還沒有找到獲取第一個字符的矢量化方法。
s = pd.Series(['aa bb cc', 'cc dd ee', 'ff ga', '0w'])
>>> s. str.split()
0 [aa, bb, cc]
1 [cc, dd, ee]
2 [ff, ga]
3 [0w]
最後,我想是這樣的:
0 [a, b, c]
1 [c, d, e]
2 [f, g]
3 [0]
感謝您考慮效率。 –
「jezrael」的答案是一個很好的答案。只是想補充一點,對於列表理解,迭代諸如Series之類的序列不需要.tolist()方法。少量數據的小點,但可以添加大型系列。 'pd.Series([[y [0] for x.split()] for x in s])'會正常工作。 – clocker