named-entity-recognition

    9熱度

    2回答

    什麼是自動標記文本與城市/地區或起源的一些好算法?也就是說,如果博客是關於紐約的,我怎麼能夠以編程方式來講述。是否有包裝/紙張聲稱以任何確定程度進行此操作? 我看了一些基於tfidf的方法,專有名詞的交集,但到目前爲止,沒有壯觀的成功,我會很感激的想法! 更一般的問題是關於如何給主題分配文本,給出一些主題列表。 在貝葉斯方法中,簡單/樸素方法更喜歡完整,但我是開放的。

    25熱度

    4回答

    我正在尋找一個簡單但「足夠好」的java命名實體識別庫(和字典),我期待處理電子郵件和文檔並提取一些「基本信息」,如: 名稱,地點,地址和日期 我一直在環顧四周,而且大多數人似乎是在沉重的一面和完整的NLP類型的項目。 有什麼建議嗎?

    5熱度

    9回答

    在HTML頁面上識別結構化數據的最佳算法是什麼? 例如Google會在電子郵件中識別住宅/公司的地址,並提供該地址的地圖。