2010-10-17 43 views
2

我想根據文本的分類(類別/偏角等)對單詞進行着色。我有一個完整的工作字典,但問題是有很多不明確的地方。例如,foedere可以是動詞「fornicate」或名詞「treaty」的形式。單詞着色和語法分析

解決這些歧義或產生良好猜測的一般策略是什麼?

謝謝!

+0

一個完整的拼寫/語法檢查器是顯而易見的解決方案,因爲那些仍然沒有得到一切正確(但將來更接近),我懷疑你是否有一次性解決方案。您可以檢查開源語法檢查器的策略。 – Wrikken 2010-10-17 14:17:28

回答

3

一般策略是首先對數據運行以確定單詞類別(名詞,動詞等)。但是,這需要數據(上下文統計)和工具。 This research paper可能是一個起點。