我試圖使用CRFSuite但我無法弄清楚如何使用示例/ ner.py和pos.py運行CRFSuite例子
準確地說,我怎麼讓表單的輸入:
# Ner.py
fields = 'y w pos chk'
或
# Pos.py
fields = 'w num cap sym p1 p2 p3 p4 s1 s2 s3 s4 y'
的「YW POS」我可以從連接1模型得到的,例如,但「CHK」的一部分,所有這些領域中pos.py我真的不明白。
此外,有沒有辦法處理原始文本(沒有所有這些標籤)與CRFSuite鑑於我有一個訓練有素的模型?
我也有興趣解決這個問題;特別是,從引用的CoNLL數據(2000年爲NER組塊,2003年爲NER,但是PoS使用什麼?)開始,我如何生成PoS數據。如所引用的,輸入必須是''w num num sym p1 p2 p3 p4 s1 s2 s3 s4 y'',這意味着這個詞本身是第一個,而PoS標記是最後一個。但是介於兩者之間的所有內容以及如何獲得並生成它們呢? – fnl
也許關於PoS部分更精確的問題應該是:如何使用這些腳本從常規的帶有PoS標籤的OWPL文件('「文字標籤\ n」...')生成PoS標籤輸入格式? – fnl