5
我正在嘗試使用Apache的PDFBox讀取PDF的內容並將其編碼爲base64,因此我可以將它流式傳輸到其他地方。爲了對它進行編碼,我使用Apache commons Base64OutputStream類。像這樣,Junit測試base64編碼字符串
ByteArrayOutputStream byteOutput = new ByteArrayOutputStream();
Base64OutputStream base64Output = new Base64OutputStream(byteOutput);
List pages = pdfDocument.getDocumentCatalog().getAllPages();
Iterator iter = pages.iterator();
while (iter.hasNext()) {
PDPage page = (PDPage) iter.next();
PDResources resources = page.getResources();
Map<String, PDXObjectImage> pageImages = resources.getImages();
if (pageImages != null) {
Iterator imageIter = pageImages.keySet().iterator();
while (imageIter.hasNext()) {
String key = (String) imageIter.next();
PDXObjectImage image = (PDXObjectImage) pageImages
.get(key);
image.write2OutputStream(base64Output);
}
}
}
String base64 = new String(byteOutput.toByteArray());
它似乎是編碼,但我需要通過編寫一個junit測試來驗證base64字符串來驗證它。以下似乎並沒有通過它。有什麼想法嗎 ?
assertTrue(content
.matches("^([A-Za-z0-9+/]{4})*([A-Za-z0-9+/]{4}|[A-Za-z0-9+/]{3}=|[A-Za-z0-9+/]{2}==)$"));
預先感謝
使用Apache常見的 「assertTrue(Base64.isBase64(內容));」似乎工作得很好。有人可以澄清爲什麼正則表達式不起作用嗎? – nixgadgets 2013-05-03 00:11:03
這確切的正則表達式適用於我,我試着做一個小的Java存根(stub)來測試它。它在Java 6和Java 7中編譯並運行成功。 https://gist.github.com/melwil/5508003 – melwil 2013-05-03 11:07:28
也許你遇到換行符?或缺少'='填充?可能「+」可能會被轉換爲HTTP傳輸中的空間。 – 2013-05-03 11:37:39