我有一個產品清單及其相應評論的數據框如何獲取數據框中的所有唯一字?
+ --------- + -------------------- ---------------------------- +
|產品|評論|
+ --------- + ------------------------------------- ----------- +
| product_a |這對休閒午餐有好處
+ --------- + ------------------------------------- ----------- +
| product_b |艾利是最知名的咖啡師之一|
+ --------- + ------------------------------------- ----------- +
| product_c |導遊告訴我們祕密|
+ --------- + ------------------------------------- ----------- +
如何獲取數據框中的所有唯一字?
我做了一個功能:
def count_words(text):
try:
text = text.lower()
words = text.split()
count_words = Counter(words)
except Exception, AttributeError:
count_words = {'':0}
return count_words
並應用功能數據幀,但只給了我的話計數每一行。
reviews['words_count'] = reviews['review'].apply(count_words)
你可以發佈你的數據框樣本嗎? –