2014-05-04 107 views

回答

1

命名實體識別是識別實體(人,地點,組織)的表面形式,即「George Bush」或「Barack Obama」是該文本字符串中的「PERSON」實體。

實體提取將從文本字符串中提取附加信息作爲屬性。例如,在「喬治W.布什是奧巴馬總統之前的總統」這句話中,承認「奧巴馬」是一位具有「頭銜=總統」屬性的人。

但是,如果你看看軟件的區別往往是模糊的。

0

沒有命名實體提取這樣的事情。
解釋更好的句子我會說,命名實體提取很簡單,具體提取以前識別的命名實體的過程。所以,從某種意義上講,沒有真正的理論知識與此任務相關,只是定義機械操作的問題。

如果我們在提取所有特定實體或一段文字關於他們的更多信息,比我們來看看信息知識提取,而不是興趣。

對於信息提取,您可以例如要求提取出現在文檔語料庫中的所有城市名稱或電子郵件地址。對於這樣的任務,可以使用命名實體提取。你甚至可以用更通用的方式,只是簡單地提取一般知識,例如以關係(關係提取)的形式提取。

欲瞭解更多詳情,我會建議書Artificial Intelligence: A Modern Approach的自然語言處理章節。