2017-02-08 25 views
0

這是問題所在。比方說,我有這樣的規則:Can TokensRegex規則可以在文檔級別註釋嗎?

{ 
    pattern: ([ner:/DATE|TIME/]), 
    action: (Annotate($0, myNER, "MY_DATETIME")) 
} 

相反註解捕獲組$ 0時,我怎麼可以指定整個文件的,有點像這樣:

{ 
    pattern: ([ner:/DATE|TIME/]), 
    action: (Annotate(<document>, myNER, "MY_DATETIME")) 
} 

這可能是一個非常有用的功能它允許在找到特定的標記模式時註釋整個文檔(或者可能是一個句子)。謝謝。

+0

我認爲這可能是可能的。 Annotate函數接受一個CoreMap,並且整個文檔是一個CoreMap。我不太清楚如何訪問特定的CoreMap,所以我會問TokensRegex創建者是否可以幫助我。敬請關注! – StanfordNLPHelp

回答

0

目前還沒有一個可行的方法來做到這一點。沒有直接的方式通過TokensRegex訪問表示文檔的CoreMap。

對於每個令牌都有一個指向文檔CoreMap的指針,那麼您可以通過查看特定的令牌來訪問TokensRegex規則中的整個文檔,但這需要對代碼進行一些更改。

如果您想打開GitHub問題,我們可以嘗試在未來版本中添加此功能。

相關問題