pdf-to-html

    6熱度

    2回答

    我一直試圖將pdf文件轉換爲單個漂亮的html頁面。衝浪後。 我得到的解決方案有點缺乏我的要求。因爲我必須創建個別html頁面來說約200個pdf文件。因爲在線轉換器可能不是一個領先的解決方案。所以我嘗試了以下解決方案以及未滿足的要求。 embed tag of html5 +嵌入PDF文件轉換爲HTML網頁很好。 - HTML頁面不可編輯,因爲它只是將pdf嵌入到html頁面。 pdftohtm

    0熱度

    1回答

    我已經使用pdfminer將複雜(表格,圖形)和非常長的pdf轉換爲html。我想進一步解析結果(例如提取表格,段落等),然後使用nltk中的句子標記器做進一步的分析。爲此,我想將html保存爲文本文件以找出如何執行解析。不幸的是我的代碼不會寫HTML爲TXT: from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterprete

    0熱度

    2回答

    我將PDF文件轉換爲HTML單個文件。當它成功轉換爲html時,文本位置與它在PDF中的位置相似(這很好)。 PDF的大小是8.5乘以11,我的問題是,當它被轉換爲HTML文本被定位在絕對定位,所以當我在移動webview中查看它的文本溢出。 這裏有人可以有類似的問題嗎?如何使絕對位置div/p適合任何屏幕?我想讓html內容看起來與pdf文件相同。 在此先感謝。

    1熱度

    2回答

    我的公司現在使用HiqPdf已經有一段時間了,我們討論了什麼渲染引擎HiqPdf解析它的html。我們無法在HiqPdf本身的網站上找到它,也沒有使用stackoverflow。 http://www.hiqpdf.com/ 我懷疑Webkit的,但沒有人知道這是否確定?

    1熱度

    1回答

    如何在多個文件或包含pdf文件的文件夾上使用pdf2htmlEX? 我可以轉換單個文件就好,但我顯然不想爲100個文件運行100次命令。 我在文檔中找不到任何東西,而'* .pdf'之類的東西不起作用。 謝謝!

    1熱度

    1回答

    我使用microsoft的表達式設計。 一個限制是缺少從.EPF或PDF(adobe文件格式)導入或轉換爲Microsoft Expression進行編輯。 我希望微軟會支持這一點,但它只是缺少過去3年爲4 版本能否請您提供一些指針。

    0熱度

    3回答

    我使用pdftohtml將pdf文件動態轉換爲html文件,我通過在Linux服務器上執行此操作。 我用下面的代碼來測試PDF到HTML的轉換: $output = shell_exec("cd pdftohtml_linux; pdftohtml test.pdf"); 它不工作,echo $output不輸出任何東西,儘管任何其它Linux命令,如ls和make工作完美罰款並顯示相應的輸出

    0熱度

    1回答

    我正在尋找一些(最好是免費的)庫,它可以幫助從指定的矩形區域提取PDF文本,頂部,寬度和高度參數。它應該可以在Linux系統上使用PHP。你能建議一個這樣的圖書館和一個工作的例子嗎?

    1熱度

    1回答

    shell命令在終端上運行此成功的Web應用程序的目錄中: pdftohtml -c -noframes "documents/document1.pdf" 現在我想通過PHP來做到這一點,所以我寫了一個shell.sh文件看起來像這樣: sudo pdftohtml -c -noframes "documents/$file" exit 0 然後我在PHP寫的: $output = s

    0熱度

    1回答

    我只是有人說使用自制軟件將PDF轉換爲HTML。我能夠下載一切,但我不知道如何執行它。有人可以一步一步地給我嗎?