0
藉助Pythons的scikit-learn軟件包中的TfidfVectorizer,我們可以輕鬆地將文檔列表轉換爲具有<term>-frequency-inverse-document-frequency
功能的數據集,其中term
是出現在文檔中的單詞。Python Term Frequency vectorizer
Python中的任何地方TfidfVectorizer的TfVectorizer類似物會產生<term>-frequency
特徵,即特徵的值不會被逆文檔頻率加權嗎?
我更喜歡使用其他編程語言編寫的Python解決方案,但如果您知道Java中的任何易於使用的實現,您還可以提到它。