2017-10-16 61 views
1

聚合值我有一個數據框下面值Python的:如何在數據幀

Text        State 
This is a beutiful day    California 
But I am stuck with code   New York 
It's too hard      California 
Can somebody please help me   Florida 
I am new to python     Florida 
How should I solve this problem  New York 
Day is turning bad     New York 
I am getting exhaused    California 
Need some help      New York 

我需要在文本狀態計算情感分析明智的。我該如何彙總文本狀態,然後進行情感分析。

df = df.groupby(df.columns.difference(['Text'])) 
result = pd.DataFrame(df['State'].unique(), columns=df.columns) 

我想這樣做,首先聚合文本,但它不工作。需要一些關於聚合的建議,以及如何使用數據框中的循環執行情感分析。

回答

1

您可以使用lambda函數對文本進行分組,文本和連接使用提供的分隔符。

`delimiter = ' ' 
df2 = df.groupby('State')['Text'].apply(lambda x: "%s" % delimiter.join(x)).reset_index() 
print (df2)` 

添加reset.index()將轉換成你需要的數據幀

+1

'申請(delimiter.join)'就足夠了。 –

+0

謝謝,它工作。您是否也可以建議我現在應該如何對'df2'數據框的每一行進行情緒分析? – Alex

+0

以及如何對文本列進行預處理和取消以移除所有停用詞,標點符號和數字 – Alex