我很努力與匹配一個3字的句子與一個二字的digram字典,它計數(第一個字和第二個字)和(第二個字和第三個字的頻率)。我想要的是如何匹配的字符串(AAA BBB CCC)是在雙精度和(AAA BBB)有一個計數和(BBB CCC)有一個計數,然後我們採取最大?Python,匹配bigram字典與文本
Counter({
('BBB', 'DDD'): 3,
('AAA', 'BBB'): 2,
('DDD', 'XXX'): 1,
('DDD', 'YYY'): 1,
('YYY', 'BBB'): 1,
('BBB', 'CCC'): 1,
('CCC', 'AAA'): 1,
('XXX', 'BBB'): 1})
plase解釋你的字典中的鍵的樣子,以及3個字序列的類型....他們是字符串還是元組或什麼? – 2013-03-10 01:48:56
你能解釋一下你想做什麼嗎?我不認爲有一種通用的方法可以知道「AAA BBB CCC」是否出現在僅給出雙字典的語料庫中。 – Blckknght 2013-03-10 01:57:27
如果我有一個句子(AAA BBB CCC)和字典的雙字節頻率。我想比較一下,如果bigram(AAA,BBB)> bigram(BBB,CCC)那麼這個句子就是括號,否則它就是正確的括號。 – Peace 2013-03-10 02:37:58