將prop文件轉換爲arff文件

我正在使用Staford classifier進行NLP相關任務。但我還需要嘗試其他機器學習算法。所以我想將prop文件轉換爲arff或者打印這些特性，然後轉換成一個arff文件。一個主要問題是分類器工具輸出的特徵具有稀疏表示（僅顯示出現的特徵）。如何實現這一目標？將prop文件轉換爲arff文件

來源

2014-01-20 Amrith Krishna

ARFF有一個sparse格式。它與非稀疏ARFF文件非常相似，但值爲0的數據未被明確表示。

稀疏ARFF文件具有相同的標題（即@relation和@attribute標記），但數據部分不同。相反，較爲了每一個值，像這樣的：

@data 
0, X, 0, Y, "class A" 
0, 0, W, 0, "class B"

非零屬性明確屬性號標識及其價值入賬，這樣的：

@data 
{1 X, 3 Y, 4 "class A"} 
{2 W, 4 "class B"}

注意this有關arff稀疏格式的問題。

來源

2014-01-20 21:49:31 greeness

在斯坦福分類器中，假設用於爲句子生成Ngram，整個句子在第1列給出。那麼這些特徵將被表示爲 '1-set1Ngram1-nextSetNgram1-nextAgain' 等等，直到所有的ngram被形成爲止。但我想這個集合中的每一個都以arff格式形成不同的特徵，所以格式應該是 '{1 set1Ngram，2 nextSetNram，3 nextAgain}而不是 {1 set1Ngram，1 nextSetNram，1 nextAgain}' –

將prop文件轉換爲arff文件

回答

相關問題