0
考慮以下基礎:計算PMI值使用給定上下文窗口
basis = "Each word of the text is converted as follows: move any consonant (or consonant cluster) that appears at the start of the word to the end, then append ay."
和下面的話:
words = "word, text, bank, tree"
我如何計算「改爲」每一個字的PMI值與「基礎」中的每個單詞相比,我可以使用上下文窗口大小5(即前兩個位置和目標單詞後兩個位置)?
我知道如何計算PMI,但我不知道如何處理上下文窗口的事實。
我計算「正常」 PMI值如下:
def PMI(ContingencyTable):
(a,b,c,d,N) = ContingencyTable
# avoid log(0)
a += 1
b += 1
c += 1
d += 1
N += 4
R_1 = a + b
C_1 = a + c
return log(float(a)/(float(R_1)*float(C_1))*float(N),2)