2016-03-21 59 views
0

我想了解GATE是否能夠從UTF-8編碼的純文本文件中提取「p」類型的註釋。使用純文本文件輸入「p」註釋

HTML文件和PDF文件工作得很好,當分析這兩種文件類型時,會添加「p」註釋。

我嘗試過使用不同的PR,但我似乎無法在原始標記下獲得類型「p」註釋。

有沒有辦法實現這個純文本文件?

回答

0

我認爲你應該使用Annotation Set Transfer PR來將「p」註釋從原始標記移動到默認設置。然後您將能夠根據您的要求使用它們。

+0

我認爲這是不可能的,因爲當GATE分析文本文件時,我沒有從原始標記中獲得任何「p」型註釋。 –

+0

絕對空的原始標記?我認爲至少有一個必須在純文本中。 GATE有一個代碼,它試圖根據一些新行的規則找到段落(據我記得,基於r \ n等)。作爲一個選項,您可以編寫自己的JAPE規則來檢測段落。 – ashingel