下面是一個代碼,我試圖從文件夾(測試器)中獲取文件的內容,該文件夾中有一些文本文件。之後,我必須從文本文件中出現的所有單詞中作出字典。我得到的字(字符串),但他們重複,我不得不刪除重複的話。刪除陣列/陣列列表中的重複字符串
實施例:
文件1 - John is coding
和file2 - John is really not coding
。
所以我想要的輸出是 - John is coding really not
,即不重複。
此外,我必須製作所有單詞和它所在的相應文本文件的矩陣(就像索引器一樣)。 例子:
file1 file2
John 1 1
is 1 1
coding 1 1
really 0 1
not 0 1
任何幫助將非常感激,我堅持。
public static void main(String[] args) throws IOException {
File folder = new File("/home/gaurav/Tester");
File[] listOfFiles = folder.listFiles();
ArrayList<String> array = new ArrayList<String>();
for (int i = 0; i < listOfFiles.length; i++) {
File file = listOfFiles[i];
if (file.isFile() && file.getName().endsWith(".txt")) {
String content = FileUtils.readFileToString(file);
String[] a = content.split(" ");
for (String s : a) {
if (!array.contains(a)) {
array.add(s);
}
}
}
}
for (int j = 0; j < array.size(); j++) {
System.out.print(array.get(j));
}
}
「s.trim()」 工作長官......非常感謝。 –