我有一張短語表,並且有一張組成這些短語的單個詞表。我想將我的短語分解爲單個單詞,收集和減少這些單詞的信息,並添加爲我的短語數據中的新列。有沒有一個聰明的方式來使用熊貓DataFrames做到這一點?將大熊貓DataFrame列拆分爲多個部分並與其他DataFrame結合
df_multigram = pd.DataFrame([
["happy birthday", 23],
["used below", 10],
["frame for", 2]
], columns=["multigram", "frequency"])
df_onegram = pd.DataFrame([
["happy", 35],
["birthday", 25],
["used", 14],
["below", 11],
["frame", 2],
["for", 13]
], columns=["onegram", "frequency"])
###### What do I do here????? #######
sum_freq_onegrams = list(df_multigram["sum_freq_onegrams"])
self.assertEqual(sum_freq_onegrams, [60, 25, 15])
只是爲了澄清,我的願望是,sum_freq_onegrams等於[60,25,15],其中60是「快樂」加「生日」的頻率的頻率。