0
是否有任何庫可以將輸入詞轉換爲所需的語法情況(屬格,主格等)和複數/單數形式?語言庫是否可以處理所需的語法情況?
基本上我對英語,德語,俄語很感興趣。
我知道有像庫apache lucene
和language-tool
,但似乎他們可以做詞幹和詞法化,可用於搜索和拼寫檢查,但不適用於文本轉換。
是否有任何庫可以將輸入詞轉換爲所需的語法情況(屬格,主格等)和複數/單數形式?語言庫是否可以處理所需的語法情況?
基本上我對英語,德語,俄語很感興趣。
我知道有像庫apache lucene
和language-tool
,但似乎他們可以做詞幹和詞法化,可用於搜索和拼寫檢查,但不適用於文本轉換。
我是LanguageTool的作者:它包含一個lemmatizer,也是相反的,我們稱之爲合成器:你可以從例如。 「走」到其基本形式「走路」,然後到其所有形式,例如,動作「走路」。不過,需要哪種形式取決於你。英語的相關代碼是https://github.com/languagetool-org/languagetool/blob/master/languagetool-language-modules/en/src/main/java/org/languagetool/synthesis/en/EnglishSynthesizer.java,俄語和德語也支持。
變換文本對於機器來說是一個特別難的問題,因爲他們需要以某種方式理解這些句子,而不是像拼寫檢查程序那樣檢查一些規則。 – zapl