2012-02-05 27 views
0

我正在使用NLTK的條件頻率分佈編寫一個用於文本預測的腳本。使用NLTK存儲條件頻率分佈

我想將分佈存儲在SQL數據庫中,以便以後使用JSON使用。它甚至有可能嗎?如果是,如何使用JSON轉儲ConditionalFrequencyDistribution格式?

或者也許有一些其他漂亮的方式來存儲它?

cfd = ConditionalFreqDist() 
prev_words = None 
cnt=0 
for word in words: 
    if cnt > 1: 
     prev_words = words[cnt-2]+' '+words[cnt-1] 
     cfd[prev_words].inc(word) 
    cnt+=1 

回答

1

你可以使用泡菜的ConditionalFreqDist()對象存儲在一個文件

f = open('file.pkl', 'w') 
pickle.dump(cfd, f) 
f.close() 

,並取回對象

#load the object 
f = open('file.pkl', 'r') 
cfd = pickle.load(f) 
f.close()