我在我的代碼,這個錯誤,我不知道如何固定 import nltk
from nltk.util import ngrams
def word_grams(words, min=1, max=4):
s = []
for n in range(min, max):
for ngram in ngrams(words, n):
s.append('
我有一個表像下面: URN Firm_Name
0 104472 R.X. Yah & Co
1 104873 Big Building Society
2 109986 St James's Society
3 114058 The Kensington Society Ltd
4 113438 MMV Oil Associates Ltd
而且我想算Fir
我有一個包含2柱csv文件「投訴詳細」和「DispositionCode'.I要的complaintDetails分爲8不同類別dispostionCode的如‘門反鎖’ ,'供應商錯誤','缺少密鑰或鎖'... 數據集顯示在圖像中。 enter image description here 什麼是很好的方法來分類和找到準確性。 起初我試圖從ComplaintDetails去除停用詞然後用naiv