我建立了一個CoreNLP服務器,並使用斯坦福NER從句子中提取時間段。爲什麼斯坦福大學NER演示將「今年」轉換爲2017年,而我的CoreNLP服務器卻沒有?
如果我使用的在線互動演示在corenlp.run解析句子
「去年發生了一些事情。」
it shows 'DATE' and '2016'。 但是,我自己的服務器搭載最新版本的CoreNLP,only shows 'DATE'。更重要的是,當我使用Python請求以相同語句查詢我的服務器的API時,響應中的前兩個令牌包含字段'timex': {'type': 'DATE','tid': 't1', 'altValue': 'THIS P1Y OFFSET P-1Y'}
和'normalizedNER': 'THIS P1Y OFFSET P-1Y'
。
如果我只是不得不面對的事實,我的輸出並不像演示的,那麼哪裏是斯坦福NER或timex3文檔解釋什麼THIS P1Y OFFSET P-1Y
手段或描述什麼其他可能的回答,我可能在normalizedNER
領域得到良好?
這裏是整個API響應
[
{'word': 'Last', 'after': ' ', 'originalText': 'Last', 'timex': {'type': 'DATE', 'tid': 't1', 'altValue': 'THIS P1Y OFFSET P-1Y'}, 'pos': 'JJ', 'ner': 'DATE', 'lemma': 'last', 'normalizedNER': 'THIS P1Y OFFSET P-1Y', 'before': '', 'index': 1, 'characterOffsetBegin': 0, 'characterOffsetEnd': 4},
{'word': 'year', 'after': ' ', 'originalText': 'year', 'timex': {'type': 'DATE', 'tid': 't1', 'altValue': 'THIS P1Y OFFSET P-1Y'}, 'pos': 'NN', 'ner': 'DATE', 'lemma': 'year', 'normalizedNER': 'THIS P1Y OFFSET P-1Y', 'before': ' ', 'index': 2, 'characterOffsetBegin': 5, 'characterOffsetEnd': 9},
{'word': 'something', 'before': ' ', 'originalText': 'something', 'ner': 'O', 'lemma': 'something', 'after': ' ', 'characterOffsetEnd': 19, 'index': 3, 'characterOffsetBegin': 10, 'pos': 'NN'},
{'word': 'happened', 'before': ' ', 'originalText': 'happened', 'ner': 'O', 'lemma': 'happen', 'after': '', 'characterOffsetEnd': 28, 'index': 4, 'characterOffsetBegin': 20, 'pos': 'VBD'},
{'word': '.', 'before': '', 'originalText': '.', 'ner': 'O', 'lemma': '.', 'after': '', 'characterOffsetEnd': 29, 'index': 5, 'characterOffsetBegin': 28, 'pos': '.'}
]
[這](https://stackoverflow.com/questions/39325657/why-does-normalizedner-for-dates-in-my-local-standford-corenlp-server-doesnt-di)可能會有所幫助。 –