0
爲了安全起見,並看到辛勤工作的成果,需要正確格式化數據的哪些功能?Wapiti/CRF ++數據集格式
我有這個dataset和template,手動標記爲NER。
就CRF ++的培訓而言,使用生成的模型進行測試會得到0%
正確的結果。使用Wapiti的結果相同。
問題,應該修改模板文件嗎?或者也需要在訓練數據集中添加POS標籤。
此外,如果模型應該打折字套管而標記,應在訓練數據集反映其全部,使得下殼體被執行。但是它會不會影響某些從大寫形式中衍生出來的句子。
在這方面有點不清楚。
PS - 針對像http://cliff.mediameter.org/這樣的模型,其中NER標記爲與套管無關。但不能使用他們的模型。
我有訓練的模型,並想測試它。 請問您還可以分享您的測試數據嗎? 您的Github賬戶有500多個回購券,我找不到合適的回扣。 – user2238884