我一直在計算我的語料庫中的單詞列表,並查看單詞列表的概率。Python:NLTK單詞列表的概率
我一直在計算每個單詞的frequcy,然後使用EXCEL進行求和,但這需要非常長的時間。我的名單上的字數是幾千..
我只想總結單詞列表的總次數,然後看單詞的概率。
genres = ['C:/A1.txt','C:/A2.txt','C:/A3.txt']
modals = ['can', 'could', 'may', 'might', 'must', 'will']
cfd = nltk.ConditionalFreqDist(
(genre, word)
for genre in genres
for word in modals)
cfd.tabulate(conditions=genres, samples=modals)
請幫助我。我一直在消耗兩天來解決這個問題。
非常感謝你提前。
您發佈的代碼有什麼問題? – Blender
我真的沒有任何問題,我的帖子..我不想統計每個單詞,但我想總結每個單詞在我的列表中的頻率.. – user976856
當我這樣做..我花了很長時間來計算列表中的每個單詞。有什麼方法可以總結我列表中所有單詞的頻率? – user976856