2016-09-21 13 views
0

我正在查找匿名文本,其中一個任務是刪除對被引用人的性別的引用。如果失去了一點意義,這是可以的,但並不是可取的(這是事實的自動化的實際後果)。確定單詞的性別

像他/她/他/她這樣的詞意味着被提及的人的性別。這些是我正在尋找的單詞。給定其中一個詞,我可以正常化(可能只是選擇其中一個詞),但我需要能夠先識別它們。

我天真的想法是通過字典搜索任何帶有指定性別的定義的單詞。這工作,但相當嘈雜。

是否有更好的方法來確定性別特定的詞(英文)或確定它們的方法(最好是自動的)?

+0

請嘗試[英語語言和使用](http://english.stackexchange.com/)。本網站僅用於編程問題。 – Mick

+0

我也會嘗試,但這是一個關於*自動化*的問題。我會重申這個問題。 – robertlayton

+0

看看http://www.nltk.org/book/ch06.html#gender-identification – alvas

回答

1

您是否有任何關於您將用於自動完成該任務的平臺/語言/軟件的信息?

例如,你可以試試這個Gate插件:Pronoun Annotator

它能夠用他們的性別註釋代詞。這可以幫助你完成任務。

+0

謝謝,這看起來相當不錯。我將使用Python,但要生成列表,它並不重要。 – robertlayton