給出一個短語,例如'Michael Jordan'或'Software Engineering'。有什麼方法可以確定它是否是一個名字?給出一個短語,如何確定它是否是一個名字?
任何研究或圖書館API或在線工具來做到這一點?
給出一個短語,例如'Michael Jordan'或'Software Engineering'。有什麼方法可以確定它是否是一個名字?給出一個短語,如何確定它是否是一個名字?
任何研究或圖書館API或在線工具來做到這一點?
它看起來像你可能會使用https://www.fullcontact.com/developer/docs/name/你正在尋找。
如果您的短語帶有上下文,您可以使用任何NERC(名爲enitity recognition and classification)工具,如Standford,Lingpipe或其他。您可以選擇需要的名稱類型 - 例如人員,組織,地點等。
如果你只有短語作爲文本字符串,那麼我只能建議使用現有的字典。有關於人名列表的question;您還可以嘗試確定該單詞是否在普通字典(如Oxford dictionary)中顯示,因爲它們很少包含專有名稱。
我沒有看到比標記潛在名稱和測試這些名稱更好的解決方案,因爲命名是一個語義概念,而不僅僅是語法 –
如果沒有正確定義'name'的概念,這個問題就無法回答。 – cel
那麼你認爲軟件工程是一個名字嗎?任何NER工具都會將Michael Jordan標記爲PER(人名實體) – Aditya