我想獲得熊貓數據框中列中n個單詞的前n/2個。 每行可以有不同數量的單詞,但每一行都有偶數個單詞。 此列包含項目的名稱,但每個名稱都重複。例如,One
變爲One One
,One Two
變成One Two One Two
。獲取熊貓數據框中列中n個單詞的前n/2個
我認爲以下工作。
- 算話
- 數量劈在空間列
- 得到這個分裂的前n/2個字
但它不工作(我只是隨便使用Python和熊貓)。 這是一個MWE。
import pandas as pd
df = pd.DataFrame(['One One', 'One Two One Two'])
df[1] = df[0].str.count('\w+')
df[2] = df[0].str.split()
df[3] = df[0].get(df[2])
P.S.如果您對R用戶的熊貓有很好的參考,請讓我知道。你