4
我想知道怎麼做服務,如A.nnotate.com,Scribd,谷歌文檔呈現PDF,.DOC,或任何其他文件轉換爲HTML和如何做的註釋系統的工作?A.nnotate.com背後使用了什麼技術?
我想知道怎麼做服務,如A.nnotate.com,Scribd,谷歌文檔呈現PDF,.DOC,或任何其他文件轉換爲HTML和如何做的註釋系統的工作?A.nnotate.com背後使用了什麼技術?
A.nnotate.com確實PDF頁面轉換成PNG圖像時使用xpdf的給定縮放級別的服務器端轉換 - 這些都是得到顯示在瀏覽器。
文本高亮由從PDF提取文本的位置,然後的話頂部的頁面圖像的頂部添加透明覆蓋有絕對定位的HTML DIVS完成。註釋然後使用ajax gui將註釋附加到突出顯示的文本。
其他格式(MS Word中,PPT等)所使用的OpenOffice首先被轉換爲PDF格式,然後以圖像和文本疊加作爲PDF文件。
我認爲其他的HTML文檔網站可以做類似於HTML的呈現PDF格式(即頁面圖像+文字覆蓋作爲透明div) - 另一個竅門是將PDF嵌入字體轉換爲HTML5 CSS字體,並使用絕對定位的div文本(&提取物和位置的圖像太)。
非常感謝!由於你的幫助,我能夠完成我的項目。 – thinkquester