我試圖運行斯坦福大學NLP分類器的例子,並對分類新數據集提出了一個問題。我發現「.test」文件包含「goldClass」,這是正確的答案以及應該測試的字符串。從數據集中製作基準,斯坦福大學NLP
示例性測試集的格式如下:
<label> <string>
<label> <String>
...
....
這是有道理的,一旦我們的模型已經從設定手分類數據創建了一個模型的評價。但是現在,一旦創建了模型,我如何對全新的數據集進行分類?我不再有相關的標籤...我只是有一組新的字符串,我想知道類...
但是要對它們進行分類,我將不得不創建一個Datum對象。要創建基準對象,我需要使用makeDatumFromLine(),它需要TSV線...爲什麼這必須是TSV?分類新數據時,指定GoldClass有什麼用處?
我希望我的問題很清楚..
我正在努力解決完全相同的問題 - 我無法找到任何分類新項目的方法。 –