2014-03-19 34 views
0

我只有一個doc文件的代碼。我需要將文件夾中的多個doc文件轉換爲相應的文本文件。如何將一個文件夾中的多個doc文件轉換爲使用java的文本文件

碼單doc文件轉換爲文本文件:

import java.io.*; 
import org.apache.poi.xwpf.extractor.XWPFWordExtractor; 
import org.apache.poi.xwpf.usermodel.XWPFDocument; 

public class ReadDocFile { 
    public static void main(String[] args) { 
     File file = null; 

     try { 
      // Read the Doc/DOCx file 
      file = new File("document"); 
      FileInputStream fis = new FileInputStream(file.getAbsolutePath()); 
      XWPFDocument doc = new XWPFDocument(fis); 
      XWPFWordExtractor ex = new XWPFWordExtractor(doc); 
      String text = ex.getText(); 

      //write the text in txt file 
      File fil = new File("D:\\wordtotextoutput\\java1new.txt"); 
      Writer output = new BufferedWriter(new FileWriter(fil)); 
      output.write(text); 
      output.close(); 
     } catch (Exception exep) { 
     } 
    } 
} 
+0

嗨avempace你可以給這個完整的場景代碼它會幫助我很多iam java初學者所以只有 – user3437426

回答

0

我只會給你邏輯。你應該可以將它轉換成java

  1. 首先輸入的文檔應該落在一個特定的文件夾中。
  2. 掃描文件夾並獲取文件夾中的文件數量。
  3. 放一個for循環並逐個獲取文件。將所有代碼邏輯放在循環中。
  4. 檢查獲取文件的文件類型。如果它的.doc/.docx處理它。
  5. 以類似的方式處理所有文件。
  6. 稍後刪除處理的文件。
0

從包裝org.apache.commons.io.FileUtils 您可以使用

FileUtils.copyDirectory(srcDir, destDir); 

,然後如果你想刪除舊文件。

相關問題