我使用斯坦福NER 3.6.0來識別人名。我從輸入文本文件或輸入XML文件生成XML沒有問題。Stanford NER,輸出編碼問題
我在閱讀由NER返回的XML文件時遇到問題。
我現在面臨的兩個問題是: 1.名稱不能以''字符開頭,十六進制值爲0xA0。
- 意外的XML聲明。 XML聲明必須是文檔中的第一個節點,並且不允許在它之前出現空白字符。
我使用JAR文件和命令提示符來生成XML輸出。
命令行:
的java -mx1000m -cp「d:/Downloads/Projects/Installations/stanford-ner-2015-12-09/stanford-ner.jar; d:/下載/項目/安裝/ stanford-ner-2015-12-09/lib/*「edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier」D:/ Downloads/Projects/Installations/stanford-ner-2015-12-09/classifiers/english.conll.4class.distsim.crf.ser.gz「-outputFormat inlineXML -textFile」C:\ Users \ Freeware Sys \ AppData \ Local \ Temp \ References(2)_in.txt「>」C:\ Users \ Freeware Sys \ AppData \ Local \ Temp \ References(2)_ner.xml「-inputEncoding」UTF-8「-outputEncoding」UTF-8「
任何幫助將不勝感激。
謝謝。
謝謝你的回答,克里斯。 NER生成的XML在通過C#中的XML DOM讀取時引發異常。 我現在面臨的兩個問題是: 1.名稱不能以''字符開頭,十六進制值爲0xA0。 意外的XML聲明。 XML聲明必須是文檔中的第一個節點,並且不允許在它之前出現空白字符。 – Mohankumar