2014-07-16 72 views
0

我有一個如此構造的CSV文件需要使用Python標記CSV列中的人名姓名NLTK

記錄|說明|日期| etc ...

1 |瑪麗珍不喜歡收到的服務。 | 07/04/02 |

我需要標記文本字段中存在專用名稱的實例。我想在CSV 1中設置兩個新列,其中指出記錄包含名稱,另一列列出記錄中的名稱。它將允許使用Google Refine在75k條記錄中運行後加快清理。我知道NLTK可以標記這些,但在如何使用它來執行這樣的任務方面還是比較新的。

輸出csv文件應該如下所示:

記錄|說明|日期|包含名稱|命名實體

1 |瑪麗珍不喜歡收到的服務。 | 07/04/02 | True |瑪麗珍

回答

相關問題