Tfidf向量不工作

2017-07-07 74 views 0 likes

我有一個語料庫（酒店點評），我想要做一些NLP過程，包括Tfidf。我的問題是，當我應用Tfidf並打印100個功能時，它不會顯示爲一個單詞，而是整個句子。這裏是我的代碼：Tfidf向量不工作

注：clean_doc是一個函數返回我的陰莖從停用詞清理，制止和等

vectorizer = TfidfVectorizer(analyzer='word',tokenizer=clean_doc, 
max_features=100, lowercase = False, ngram_range=(1,3), min_df = 1) 
vz = vectorizer.fit_transform(list(data['Review'])) 
feature_names = vectorizer.get_feature_names() 
for feature in feature_names: 
    print(feature)

返回是這樣的：

love view good room 
food amazing recommended 
bad services location far 
-----

任何想法爲什麼？在此先感謝

來源

2017-07-07 Yousra Gad

你能告訴我們你的clean_doc函數的代碼嗎？ – yvespeirsman

回答

這很可能是您的clean_doc函數中的錯誤。 'tokenizer'參數應該是一個函數，它接受一個字符串作爲輸入並返回一個記號列表。

來源

2017-07-07 15:13:35 Lgiro

你是對的。該函數以列表的形式返回數據。所以我糾正它。謝謝：） –

相關問題

11. 變量不工作
12. Matlab調用Python，返回向量，str2num不能在返回的向量上工作
13. MATLAB行向量+行向量=數組在r2017a中工作，但不在r2016a
14. 笨重定向（）不工作
15. XAMPP重定向不工作
16. 404重定向不工作
17. URL重定向不工作
18. 重定向（url）不工作
19. AJAX重定向不工作
20. HTTPS重定向不工作
21. PLayframework重定向不工作
22. wordpress重定向不工作
23. ASP重定向不工作
24. 重定向回不工作
25. 重定向uri不工作
26. 雙向綁定工作不
27. 重定向301不工作
28. 重定向301不工作
29. 鏈表反向不工作....？
30. Angular.js - 重定向不工作