2016-12-04 23 views
1

我想要做的是創建一個多選題(MCQ)生成填補空白樣式問題生成器。我需要從密鑰生成干擾字符(錯誤答案)(正確答案)。 MCQ由用戶輸入的教育文本生成。我們正試圖通過結合上下文相似性,關鍵詞和分心詞出現的句子的相似度以及詞頻的差異來解決這個問題。我正在考慮使用大數據數據集來生成相關的干擾項,例如google vision提供的干擾項,我不知道如何在python中實現這一點。我怎樣才能找到一個使用python的密鑰良好的干擾

回答

1

這個問題太寬泛,無法回答,儘管我會盡我所能給你一些指示。

如果您有一組封閉的潛在干擾者,我會使用單詞/短語嵌入來尋找最接近正確答案的干擾者。

Gensim's word2vec在Python

如果你希望你的分心遵循一個模板,例如從與它相對的正確答案替換某個詞,我會用nltk's wordnet實現找到antonyns一個很好的起點/同義詞。