我最近開始研究德語文本中的情感分析項目,並計劃使用詞法分析器來改進結果。德語中的Python情感分析NLTK
NLTK附帶德國雪球乾燥器,我已經試過使用它,但我不確定結果。也許它應該是這樣,但作爲一個計算機科學家而不是語言學家,我有一個問題與屈曲動詞形式源於不同的詞幹。
取「suchen」(搜索)這個詞,它被認爲是第一人稱單數的「such」,而第三人稱單數是「sucht」。
我知道也有詞形化,但據我所知,沒有工作的德語lemmatizer被整合到NLTK中。有GermaNet,但他們的NLTK集成似乎已被中止。
到達這一點:我希望折中的動詞形式被歸爲同一詞幹,至少對於同一時期內的常規動詞。如果這不是我的目標有用的要求,請告訴我爲什麼。如果是這樣,你知道有哪些額外的資源可以幫助我實現這個目標嗎?
編輯:我忘了提及,任何軟件都應該可以免費用於教育和研究目的。
謝謝,我一定會試一試,當我回到它。 – Florian