我正在使用依賴樹解析器製作應用程序。實際上,解析器是這樣的: Parser Stanford,但它很少會更改我想分析的句子中的一些或兩個字母。這對我來說是一個很大的麻煩,因爲在這些變化中我看不到任何模式,並且我需要依賴樹和我的句子相同的單詞。斯坦福大學NLP依賴樹解析器中缺失單詞
我能看到的只是一些詞有這些問題。我正在使用推文數據庫。所以,我在這個數據中有很多語法錯誤。例如,標籤「#AllAmericanhumour」成爲AllAmericanhumor。它錯過了一個字母(u)。
我能做些什麼來解決這個問題嗎?在我的第一個觀點中,我想使用編輯距離算法,但我認爲這可能是一個更簡單的方法。
謝謝大家提前