0
我正在使用Apache POI 3.9從.docx文件中提取表格內容。此文檔包含不同部分下的多個表格。我可以提取所有表格內容而不考慮部分,但我只想提取特定部分下的表格內容。任何人都可以幫忙嗎?Table Content Extraction部分明智的.docx文件
.DOCX輪廓:
第1節:ABC 表1: 表2: 第2節:CDE 表3: 表4:
表提取碼:
XWPFDocument documentContent = new XWPFDocument(inputStream);
Iterator<IBodyElement> bodyElementIterator = documentContent.getBodyElementsIterator();
while(bodyElementIterator.hasNext())
{
IBodyElement element = bodyElementIterator.next();
if("TABLE".equalsIgnoreCase(element.getElementType().name()))
{
List<XWPFTable> tableList = element.getBody().getTables();
//Extract the table row name and their corresponding values from the word stream content
tableRowValues = getTableRowValues(tableList);
}
}
方法: private static ArrayList getTableRowValues(List tableList){
ArrayList<String> tableValues = new ArrayList<String>();
for (XWPFTable xwpfTable : tableList)
{
List<XWPFTableRow> row = xwpfTable.getRows();
for (XWPFTableRow xwpfTableRow : row)
{
List<XWPFTableCell> cell = xwpfTableRow.getTableCells();
for (XWPFTableCell xwpfTableCell : cell)
{
List<XWPFParagraph> para = xwpfTableCell.getParagraphs();
for (XWPFParagraph xwpfTablePara : para)
{
if(xwpfTablePara!=null)
{
tableValues.add(xwpfTablePara.getText());
}
}
}
}
}
return tableValues;
}
文檔誰能請幫助? – sam