0
我正在使用Staford classifier進行NLP相關任務。但我還需要嘗試其他機器學習算法。所以我想將prop文件轉換爲arff或者打印這些特性,然後轉換成一個arff文件。一個主要問題是分類器工具輸出的特徵具有稀疏表示(僅顯示出現的特徵)。如何實現這一目標?將prop文件轉換爲arff文件
我正在使用Staford classifier進行NLP相關任務。但我還需要嘗試其他機器學習算法。所以我想將prop文件轉換爲arff或者打印這些特性,然後轉換成一個arff文件。一個主要問題是分類器工具輸出的特徵具有稀疏表示(僅顯示出現的特徵)。如何實現這一目標?將prop文件轉換爲arff文件
在斯坦福分類器中,假設用於爲句子生成Ngram,整個句子在第1列給出。那麼這些特徵將被表示爲 '1-set1Ngram1-nextSetNgram1-nextAgain' 等等,直到所有的ngram被形成爲止。但我想這個集合中的每一個都以arff格式形成不同的特徵,所以格式應該是 '{1 set1Ngram,2 nextSetNram,3 nextAgain}而不是 {1 set1Ngram,1 nextSetNram,1 nextAgain}' –