0
我想比較不同的文檔。如何在表示同義詞時克服衝突,這個例子會給出不同的向量。儘管它們具有相同的含義。使用NLTK比較兩個同義詞
text1, text2= "I like birds", "I admire birds"
from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer(stop_words='english')
tfidf = vectorizer.fit_transform([text1, text2])
注:我發現一些論文指的是Latent Semantic analysis
,是否支持NLTK?
非常好!感謝澄清這一點。 – user3378649 2014-11-23 16:07:20