pdf-conversion

1熱度

2回答

我一直在這一段時間DOM轉換和所有我能發現是這樣的pdf2dom解析器和可能的this一個逆向工程的版本。無論如何，這是我的問題。對於任何渲染引擎，其輸入應該是一個數據流（在我的情況下，PDF內容），其輸出應該是一個選定的格式（在我的情況下，DOM，HTML & CSS）。但是，而不是使用Java或C++，是有可能，我得到「的PDF數據」流（這是我有關於不知道）從服務器和存儲到一個JavaScr

2熱度

3回答

PDF to HTML或同級

我正在構建一個應用程序，通過瀏覽器查看pdf，而不需要移動設備上的插件。我試過ImageMagick和ghostscript將頁面轉換爲圖像，但它們太大而文字變得不清晰。我看到網站提供了將PDF轉換爲html並執行下降工作的服務，但是我找不到如何完成這個工作的例子。任何幫助深表感謝。謝謝！

2熱度

3回答

只將第一個Word文檔頁轉換爲PDF

我一直在尋找一段時間，但是我找不到太多的幫助。我希望有人能幫我解決這個問題，因爲我真的很難過。我正在使用Office 2010和C＃4.如何才能將Word文檔的第一頁轉換爲PDF？這site幫助我開始，但它只顯示我如何將整個文檔保存爲PDF。有沒有辦法：只保存第一頁爲PDF？（最理想的選擇）刪除所有剩餘的頁面，然後另存爲PDF？我該如何去做呢？

4熱度

1回答

如何處理將文檔從PDF轉換爲文本時的Unicode字符編碼問題

我試圖從PDF中提取文本。 PDF包含印地文（Unicode）文本。我正在使用的提取實用程序是Apache PDFBox（http://pdfbox.apache.org/）。提取器提取文本，但文本不可識別。我嘗試在許多編碼和字體之間進行更改，但預期的文本仍然無法識別。這裏有一個例子：在PDF 說文字是：पवार 什麼樣子後提取：̄Ö3/4ÖÖü 有什麼建議嗎？

80熱度

2回答

如何使用pdf.js

我正在考慮使用pdf.js（允許在網頁中嵌入pdf的開源工具）。沒有關於如何使用它的任何文檔。我假設我所做的是在頭文件中引用的腳本創建一個html頁面，然後在正文中，我使用文件名和位置的數組進行某種函數調用。有人可以幫我從這裏出去嗎？

0熱度

2回答

java excel至pdf轉換

我需要將xlsx文檔轉換爲pdf格式。我知道iText可以保存pdf文檔和Docx4j可以讀寫xslx。實際上，我們的應用程序既用於構建報告。但是我們有非常困難的模板，所以我不能只讀取xslx（docx4j）並將其寫入pdf（iText）。格式化會丟失，所以我需要另一個轉換庫。我也聽說過像商業圖書館（Jxcell）但想使用開源解決方案。任何人都可以幫助我嗎？

3熱度

2回答

是否有任何ePub庫

我想寫轉換器，讓我完全控制PDF轉換爲ePUB？我在看什麼是轉換器 -不應該削減在最後一行的話。如果文本是一段那麼epub必須是一個段落沒有任何額外的空間字符和切割的單詞。 - 應該識別pdf文檔中的書籤，並且應該在epub 版本中創建一個內容表（TOC）。應調整圖像大小。應該是UTF8，它必須與土耳其字符兼容。請建議我使用此庫嗎？

1熱度

2回答

PDF轉換器的HTML（URL）是否作爲窗口小部件類型服務存在

我們正嘗試在我們自己的服務器上快速安裝.Net PDF創建器。有沒有可以嵌入到網站的應用程序，並允許用戶生成該網址或其他網址的PDF？免費或付費並不重要，要爲客戶打造，因此我們正在努力尋找一個高質量的PDF渲染太多，謝謝 PS或可以有人建立這個？

2熱度

2回答

ConversionJob在SharePoint2010到DOCX轉換爲PDF需要很長的時間和很慢

我一直在使用ConversionJob在SharePoint 2010中到的docx文件轉換爲PDF，它需要很長的時間，大約10分鐘。這真的很慢嗎，還是因爲我服務器上的資源有點慢？因爲我的開發服務器需要10分鐘，我擔心通過互聯網所花的時間。有什麼方法可以讓SharePoint更快速地使用SharePoint 2010嗎？我使用C＃，Open XML來操作和創建docx，然後使用SharePo

0熱度

1回答

itextsharp PdfTextExtractor拼寫錯誤

我們的數據庫中有一個二進制PDF文件。我將它流出並保存爲PDF文件，並用兩種來源進行測試，最後得到相同的結果：PdfTextExtractor拼寫錯誤。例如，在PDF中有一個單詞「確認」。在PdfTextExtractor轉換它之後，它被拼寫爲「confrmed」。我在調試過程中逐步完成了這個過程，並且它在被PdfTextExtractor轉換後立即拼錯，所以我確定它不是不準確的，因爲我正在做