我有句子的列表:組詞的二元語法句子的列表與Python
text = ['cant railway station','citadel hotel',' police stn'].
我需要形成二元對,並將其存儲在一個變量。問題是,當我這樣做時,我會得到一對句子而不是單詞。下面是我做的:
text2 = [[word for word in line.split()] for line in text]
bigrams = nltk.bigrams(text2)
print(bigrams)
這將產生
[(['cant', 'railway', 'station'], ['citadel', 'hotel']), (['citadel', 'hotel'], ['police', 'stn'])
無法火車站和城堡酒店形成一個兩字。我想要的是
[([cant],[railway]),([railway],[station]),([citadel,hotel]), and so on...
第一句的最後一個單詞不應與第二句的第一個單詞合併。 我該怎麼做才能使它工作?
現在有;) –