-1
我正在與bigrams合作,我有一個問題。我有正確的答案,但在錯誤格式奇怪的Bigram問題
import nltk
import collections
import collections
from collections import defaultdict
cnt = collections.Counter()
tokens = [['a','b','c','d'],['b','c','a','b','c']]
def bigram(tokens, n):
for toks in tokens:
cnt.update(nltk.bigrams(toks))
return cnt.most_common(n)
print bigram(tokens, 2)
我能得到正確的輸出:[(('b', 'c'), 3), (('a', 'b'), 2)]
但我需要它是[(('b c'), 3), (('a b'), 2)]
。我問教授我是否可以重新排列參數,但他堅持要求輸入必須是bigram(tokens, n)
才能獲得完整的學分。
不要寫作業。他不會學到任何東西。 – user38034 2015-02-06 20:11:13
@ user38034:他的教授將足夠聰明,可以在他的幾行代碼中使用谷歌,並且會在這裏結束;谷歌真的不是剽竊者的朋友。我相信Datguyovrder足夠聰明,可以真正理解我寫的東西 - 否則,他的教授就會被注意到,因爲很明顯,如果有人一直在試圖讓他的不合規解決方案通過,但是突然出現了正確的一個,你開始提問像「這是如何工作的?」。 – 2015-02-06 20:14:31
我認爲教授有更重要的事情要做,而不是谷歌他的學生的代碼。 – user38034 2015-02-06 20:21:25