0
A
回答
2
給你一個SummaryInformation對象。最後,我找到了答案
這裏是代碼片段...
File file = null;
FileInputStream fis = null;
HWPFDocument document = null;
Range commentRange = null;
try {
file = new File(fileName);
fis = new FileInputStream(file);
document = new HWPFDocument(fis);
commentRange = document.getCommentsRange();
int numComments = commentRange.numParagraphs();
for (int i = 0; i < numComments; i++) {
String comments = commentRange.getParagraph(i).text();
comments = comments.replaceAll("\\cM?\r?\n", "").trim();
if (!comments.equals("")) {
System.out.println("comment :- " + comments);
}
}
} catch (Exception e) {
e.printStackTrace();
}
我正在使用Poi poi-3.5-beta7-20090719.jar,poi-scratchpad-3.5-beta7-20090717.jar。其他檔案 - poi-ooxml-3.5-beta7-20090717.jar和poi-dependencies-3.5-beta7-20090717.zip - 如果您希望在基於OpenXML的文件格式上工作,將需要其他檔案。
我很欣賞馬克B的幫助究竟是誰發現了這個解決方案....
0
獲取HWPFDocument對象(通過在輸入流中傳遞一個Word文檔,說的)。
然後你就可以通過getSummaryInformation()得到總結,這將通過getSummary()
+0
非常感謝Brian ... – Garudadwajan 2009-07-15 04:09:56
0
0
我也是新到apache poi。聽到是我的程序工作正常這個程序提取word格式的文本到文本...我希望這個程序將幫助你在你運行這個程序之前,你可以在你的類路徑中設置相應的lib文件。
/*
* FileExtract.java
*
* Created on April 12, 2010, 9:46 AM
*
* To change this template, choose Tools | Template Manager
* and open the template in the editor.
*/
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import javax.swing.text.BadLocationException;
import javax.swing.text.DefaultStyledDocument;
import javax.swing.text.rtf.RTFEditorKit;
import java.io.*;
import org.apache.poi.POIOLE2TextExtractor.*;
import org.apache.poi.POIOLE2TextExtractor;
import org.apache.poi.POITextExtractor;
import org.apache.poi.extractor.ExtractorFactory;
import org.apache.poi.hdgf.extractor.VisioTextExtractor;
import org.apache.poi.hslf.extractor.PowerPointExtractor;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.extractor.ExcelExtractor;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import javax.swing.text.Document;
/**
*
* @author ChandraMouil V
*/
public class RtfDocTextExtract {
/** Creates a new instance of FileExtract */
static String filePath;
static String rtfFile;
static FileInputStream fis;
static int x=0;
public RtfDocTextExtract() {
}
//This function for .DOC File
public static void meth(String filePath) {
try {
if(x!=0){
fis = new FileInputStream("D:/DummyRichTextFormat.doc");
POIFSFileSystem fileSystem = new POIFSFileSystem(fis);
WordExtractor oleTextExtractor = (WordExtractor) ExtractorFactory.createExtractor(fileSystem);
String[] paragraphText = oleTextExtractor.getParagraphText();
FileWriter fw = new FileWriter("E:/resume-template.txt");
for (String paragraph : paragraphText) {
fw.write(paragraph);
}
fw.flush();
}
}catch(Exception e){
e.printStackTrace();
}
}
}
相關問題
- 1. 閱讀java中的excel文件Apache Poi?
- 2. Apache POI註釋Excel
- 3. Apache Poi - 如何刪除Word文檔中的所有鏈接
- 4. 使用Apache POI從Word文檔中讀取部分
- 5. 使用Apache POI編輯Word文檔
- 6. Apache poi word文檔空指針異常
- 7. 使用POI或DOCX4J插入註釋到word文檔
- 8. 在使用Apache POI和Apache PDF閱讀器閱讀文檔,pdf文件中的錯位文本框
- 9. 閱讀java中的微軟word文檔
- 10. 閱讀C#中的word文檔
- 11. 閱讀UWP中的MS WORD文檔
- 12. 閱讀和Word文檔
- 13. 閱讀Excel中使用的Apache POI
- 14. 閱讀使用Apache POI
- 15. 從apache poi閱讀XLSB
- 16. xlsx通過apache poi閱讀
- 17. 使用Apache POI的CTPageSZ類中的錯誤Java NetBeans Word文檔
- 18. yardoc:排除來自文檔的註釋
- 19. 使用Apache Poi解析Word文檔中表格中的表格
- 20. 如何閱讀Microsoft Word文檔中的彩色文本
- 21. 如何使用Apache POI從MS Word文檔的文本框中獲取文本?
- 22. 如何使用apache poi爲word文檔設置頁邊距?
- 23. 如何閱讀asp.net中word文檔中的複選框
- 24. Word文檔的閱讀索引(目錄)
- 25. 閱讀Word文檔的Java庫
- 26. Word文檔中的Apache POI圓形項目符號列表
- 27. 使用Apache POI將任何形狀插入到word文檔中
- 28. 使用Apache POI在MS Word文檔中添加文本
- 29. 如何使用Apache Word POI在word文件中創建Combobox?
- 30. 閱讀MS Excel中使用Apache POI
Word文檔有多種形式。你能澄清一下你想讀的文件類型嗎? Word 97/2003 .doc,Word 2007 XML等 – 2009-07-13 14:59:03
我想閱讀97/2003/xp和2007 word文件中的評論... – Garudadwajan 2009-07-14 03:47:44