我需要將PDF文件轉換爲HTML文件(IOS平臺),以便我可以使用Javascript註釋HTML頁面。我在註釋HTML頁面方面取得了一些成功,所以如果我可以將PDF轉換爲HTML,我可以完成我的任務。我怎麼做轉換?我們可以使用C,C++或Java(任何語言)將PDF文件轉換爲HTML嗎?
回答
從PDF轉換通常非常困難(最好)。
PDF包含繪圖說明。 「從這裏到那裏」,「在這些座標處的這些字符」。有通常沒有關於這些行,字符和圖像的邏輯意義的信息,雖然「文檔結構」變得越來越普遍。
如果沒有「文檔結構」和「標記的內容」,很難從「一堆行和字符」轉到「在這些列和行中具有此信息的表格」。
不是不可能的,只是很難。
而那些在這個問題上工作過的人並不都對分享他們的代碼感興趣。
http://bisqwit.iki.fi/source/pdf2simplehtml.html - >這裏有一些源代碼將PDF轉換爲html。只有簡單的文本將被轉換爲HTML。 – 2011-05-12 06:46:10
而且這段代碼附帶了一堆免責聲明(和coupd使用我想象的更多)。我支持我的評估。 – 2011-05-14 06:39:04
感謝您的評論... – 2011-05-16 09:29:02
這將是很難轉換任何pdf,其中一些太複雜的HTML。
看看libpoppler它已經有pdf2html函數,它是開源的,你可以隨時擴展它,所以它符合你的要求。
你可以給我鏈接到libpoppler。 – 2011-05-12 09:18:37
我可以在我的IOS程序中集成libpoppler代碼嗎?我在我的iMac中下載了該代碼。但我很笨,如何在我的項目中使用它:( – 2011-05-12 10:25:34
試着編譯它並看看'pdftohtml.cc'。我不知道,如果你可以在你的程序中集成poppler,那麼它是在GPL下。 – p4553d 2011-05-12 13:46:05
- 1. 我們可以使用PHP將XDP轉換爲PDF嗎?
- 2. c#將pdf轉換爲html
- 3. 轉換HTML文件爲PDF使用Java
- 4. 我們可以將列表轉換爲C#中的DataTable嗎?
- 5. 將PDF轉換爲HTML文件Java API
- 6. Java Jsp - 我們可以將輸出保存爲PDF或Word文件嗎?
- 7. 我可以使用Word 2003組件通過使用C#將.doc文件轉換爲.pdf嗎?
- 8. 將任何文件類型轉換爲使用Java API的pdf
- 9. 使用java將文件轉換爲PDF
- 10. 我們可以用C語言的語法編寫Objective-C代碼嗎?
- 11. 使用C#將文化轉換成語言環境或LCID
- 12. 如何使用Java將HTML網頁轉換爲PDF文件
- 13. 任何人都可以將其轉換爲C#代碼嗎?
- 14. 將xml文件轉換爲pdf c#
- 15. 將C#錶轉換爲PDF文件
- 16. 如何使用C或C++將.caf文件轉換爲.wav?
- 17. 我們可以使用opennurbs將3dm文件轉換爲stl或obj文件C++ sdk
- 18. 我們可以在C語言的printf()函數內使用printf語句嗎
- 19. 我可以使用google API將PDF轉換爲PNG嗎?
- 20. 我可以使用任何JVM語言爲android編程嗎?
- 21. 我們可以使用多線程將Microsoft Word文檔轉換爲C#中的HTML嗎?
- 22. 任何人都可以將此SQL查詢轉換爲C#Linq語句嗎?
- 23. 我可以將Illustrator文件轉換爲HTML嗎?
- 24. 如何將英語單詞轉換爲使用c語言的本地語言
- 25. 我們可以說「C語言運算符是多態的」嗎?
- 26. 有沒有任何Java庫將文檔從PDF轉換爲HTML?
- 27. 是否有任何Java庫將文檔從HTML轉換爲PDF?
- 28. 如何使用ghostPCL與c#將pcl文件轉換爲pdf
- 29. 將Java轉換爲C#或VB.net到C#
- 30. 將html文件轉換爲PDF文件?
請重新說明問題並更具體。你在開發什麼平臺?你使用哪種語言?詢問之前你有沒有尋找類似的問題? – marzapower 2011-05-10 13:59:23
http://www.google.com/search?q=pdf+to+html – 2011-05-10 21:31:19