0
我有一個如此構造的CSV文件需要使用Python標記CSV列中的人名姓名NLTK
記錄|說明|日期| etc ...
1 |瑪麗珍不喜歡收到的服務。 | 07/04/02 |
我需要標記文本字段中存在專用名稱的實例。我想在CSV 1中設置兩個新列,其中指出記錄包含名稱,另一列列出記錄中的名稱。它將允許使用Google Refine在75k條記錄中運行後加快清理。我知道NLTK可以標記這些,但在如何使用它來執行這樣的任務方面還是比較新的。
輸出csv文件應該如下所示:
記錄|說明|日期|包含名稱|命名實體
1 |瑪麗珍不喜歡收到的服務。 | 07/04/02 | True |瑪麗珍