2
A
回答
1
有在WEKA實現了一些轉換器,只要找到正確的格式或使(用awk,sed的...)到你的數據變化不大。
下面是與該主題相關的API網頁:http://weka.sourceforge.net/doc.stable/weka/core/converters/package-summary.html
對於exapmle這裏是如何從CSV轉換爲ARFF:
java weka.core.converters.CSVLoader filename.csv > filename.arff
0
下面是代碼,您可以使用
package text.Classification;
import java.io.*;
import weka.core.*;
public class TextDirectoryToArff {
public Instances createDataset(String directoryPath) throws Exception {
FastVector atts;
FastVector attVals;
atts = new FastVector();
atts.addElement(new Attribute("contents", (FastVector) null));
String[] s = { "class1", "class2", "class3" };
attVals = new FastVector();
for (String p : s)
attVals.addElement(p);
atts.addElement(new Attribute("class", attVals));
Instances data = new Instances("MyRelation", atts, 0);
System.out.println(data);
InputStreamReader is = null;
File dir = new File(directoryPath);
String[] files = dir.list();
for (int i = 0; i < files.length; i++) {
if (files[i].endsWith(".txt")) {
double[] newInst = new double[2];
File txt = new File(directoryPath + File.separator + files[i]);
is = new InputStreamReader(new FileInputStream(txt));
StringBuffer txtStr = new StringBuffer();
int c;
while ((c = is.read()) != -1) {
txtStr.append((char) c);
}
newInst[0] = data.attribute(0).addStringValue(txtStr.toString());
int j=i%(s.length-1);
newInst[1] = attVals.indexOf(s[j]);
data.add(new Instance(1.0, newInst));
}
}
return data;
}
public static void main(String[] args) {
TextDirectoryToArff tdta = new TextDirectoryToArff();
try {
Instances dataset = tdta.createDataset("/home/asadul/Desktop/Downloads/text_example/class5");
PrintWriter fileWriter = new PrintWriter("/home/asadul/Desktop/Downloads/text_example/abc.arff", "UTF-8");
fileWriter.println(dataset);
fileWriter.close();
} catch (Exception e) {
System.err.println(e.getMessage());
e.printStackTrace();
}
}
}
相關問題
- 1. 如何將稀疏矩陣數據轉換爲WEKA的arff文件格式?
- 2. 如何將.arff格式的文件轉換爲.txt文件格式?
- 3. 將prop文件轉換爲arff文件
- 4. weka sparse arff文件
- 5. 使用weka將CSV轉換爲ARFF
- 6. 使用Weka Java代碼 - 如何將CSV(無標題行)轉換爲ARFF格式?
- 7. 合併.ARFF文件 - Weka
- 8. 轉換文本數據集.arff文件
- 9. 如何將clusterer模型保存爲arff或csv文件(WEKA JAVA)
- 10. 爲Weka Apriori輸入arff文件
- 11. 如何將兩列的文本文件轉換爲fasta格式
- 12. 如何將從.arff文件加載的arff對象轉換爲數據框格式?
- 13. 將文本文件的格式轉換爲其他格式
- 14. 通過TextDirectoryToArff.java將txt文件轉換爲arff文件
- 15. 自動將單個txt文件轉換爲arff文件
- 16. Python:如何將降價格式文本轉換爲文本
- 17. JSON - 如何將純文本格式轉換爲json格式?
- 18. WEKA文件格式
- 19. 如何爲weka創建一個arff文件?
- 20. 如何在Weka中爲高維矢量創建ARFF文件?
- 21. 未將文本轉換爲HTML格式
- 22. VB.Net將文本轉換爲WWW格式
- 23. 將文本轉換爲PDU格式
- 24. 將RTF轉換爲純文本格式
- 25. 在使用Weka將CSV轉換爲ARFF時的錯誤
- 26. 使用weka jar將csv轉換爲arff時出錯
- 27. 如何將點雲.pts文件轉換爲.pcd文件格式?
- 28. 如何將.npz格式轉換爲.py格式的.csv文件?
- 29. Weka打印稀疏arff文件
- 30. WEKA預測多個ARFF文件
另請參閱:http://stackoverflow.com/questions/13915683/how-to-convert-a-log-system -file-into-arff-format 請注意,Weka只在分類上很好,它的集羣功能幾乎不存在。 –