我有一個文件,其中包含由\ t分隔的不同推文的信息。該信息包含用戶,語言和文本字段。逐行讀取文件並存儲到多維數組或陣列表中
我需要做的是將關於推文的信息存儲在ArrayList或數組中,以便每個單詞都是分開的,這樣我就可以遍歷它們並對它們進行比較。
這裏是文件
@GracieWhitton en RT @GracieWhitton: I need 16 more followers to 2500. I know you are out there!! Come on folks. :)
@SHARPErThnYu en RT @SHARPErThnYu: Stop texting me. Our relationship is non existent
@BraandiiSongz fr RT @BraandiiSongz: Le 1er rdv chui tj timide ac une grosse boule au ventre apr c autre chose
@BeyTomce en @BeyTomce Saturday ???
@VivoPorVoceLuaB pt @VivoPorVoceLuaB Segui,Sdv amore
@JamelTaylour en "@str8BappN: @JamelTaylour That go bruh"right on bro
@eluniweb es RT @eluniweb: #UCAB mañana martes 16 de abril hay clases http://t.co/ZeUzGBM7MI
@MariAleAguirre es RT @MariAleAguirre: Que CINISMO el de El Ciudadano en GLOBOTERROR. Esta diciendo que VTV fue el que llamo a la violencia en Altamira... ...
這裏是我的代碼的例子,我不知道爲什麼它doesen't工作,因爲我想要的。我不知道如何迭代數據。
public Tweets() throws FileNotFoundException {
Scanner in=new Scanner(new File("./twitter/data.txt"));
ArrayList<ArrayList<String>> comments= new ArrayList<ArrayList<String>>();
while(in.hasNext()){
String line=in.nextLine();
String[] data=line.split("\t",-1);
ArrayList<String> words = new ArrayList<String>();
words.add(data[0]);
words.add(data[1]);
String[] w=data[2].split(" ",-1);
for(int i=0;i<w.length-1;i++)
{
words.add(w[i]);
}
comments.add(words);
}
in.close();
}
已經檢查過。同樣的問題:/ –
嘗試'String [] data = line.split(「\\ t」, - 1);' – LiverpoolFTW