1
我有一些從CoreNLP輸出的文件,格式爲.conll
,我想將它們反序列化爲Annotation
對象。 CoreNLP是否提供CONLL-X DocumentReader
方法將.conll
文件轉換爲Annotation
對象,還是必須創建我自己的DocumentReader?如何使用Corenlp將.conll文件加載到Annotation對象中?
我有一些從CoreNLP輸出的文件,格式爲.conll
,我想將它們反序列化爲Annotation
對象。 CoreNLP是否提供CONLL-X DocumentReader
方法將.conll
文件轉換爲Annotation
對象,還是必須創建我自己的DocumentReader?如何使用Corenlp將.conll文件加載到Annotation對象中?
你可以嘗試像TSVSentenceIterator這樣的東西,它從CoNLL格式的TSV文件讀取句子。
但是,請注意懸掛Annotation對象的Annotations數量遠多於CoNLL文件中的列數(例如,字符偏移量等),因此此序列化不會是無損的,如果要繼續註釋對象,可能會出現意想不到的行爲。這不是官方支持的無損序列化策略之一。
我下載了項目,但是我找不到將文件作爲輸入並返回TSVSentenceIterator中的註釋對象的方法 – Gha93
您必須自己讀取文件,然後將行列表傳遞給構造函數。 –
所以我必須將我的文件逐句發送到'public static Sentence toSentence(List fields,List entries)'方法。條目中的每個字符串相當於一個令牌行? –
Gha93