2011-12-16 21 views
0

我有一個客戶是齒輪和鏈條製造商等,他們有一個200頁的目錄,主要包括文本,數字表和大量的圖表。我必須將內容(保持格式)傳輸到新網站,並且我已經開始一次傳輸數據1頁的過程。這裏的內容我與處理的類型的例子:尋找PDF格式目錄轉換爲html的建議

enter image description here

任何想法如何,我可以自動化這樣的轉換?

回答

0

pdftocairo

是一個轉換工具,能夠轉碼PDF內容,因爲它是,保持完全相同的佈局,爲多種格式,其中之一是svg

SVG可以在網絡中使用,html頁面,Mozilla的瀏覽器都有一個嵌入SVG瀏覽器(Explorer需要免費插件的Adobe SVG瀏覽器)

它可能是最好的解決方案,但是我們需要看一看到單SVG的大小產生

到PDF的所有頁面轉換成SVG(確切地看着PDF頁面)您需要先爆單頁PDF的專用目錄(然後你移動你的代碼的PDF一個目錄)

pdftk yourfile.pdf burst && move yourfile.pdf .. 

然後用pdftocairo遞歸

for f in *.pdf; do pdftocairo -svg $f; done 

如果產生SVG的規模並不太大,他們可以在網站上使用,否則,你需要使用

pdftohtml

希望佈局保持不變

+0

感謝您的回覆。 SVG的問題,除了在某些瀏覽器中需要插件,我們需要將文本轉換爲直接的html,以便可搜索和索引。然而,我很欣賞冗長的迴應,並且可能將其標記爲答案,除非有人能夠通過更好的選擇。 – box86rowh 2011-12-17 04:37:44