2010-02-26 67 views
1

給定一個PDF文檔,是否可以生成一個XSL-FO(FOP)模板?是否可以從PDF生成XSL-FO模板?

很明顯,這將是一次性的事情 - 生成的模板只是創建適當的模板的起點,可以提取適當的數據。

對我來說,這樣做的理想工具是基於Java的工具,應該可以從命令行或通過ANT任務執行。否則,這將是在Linux和MacOS X上運行的東西。

回答

2

我知道沒有這樣的工具。沒有文檔結構信息的PDF(標籤PDF)非常像掃描頁面。沒有語義。你甚至不能確定你能猜出段落開始或結束的正確位置。如果您使用標記PDF,則可能會稍微進一步,具體取決於文檔結構中的詳細程度。但我很肯定你永遠不會得到滿意的結果。海事組織你更快地學習XSLT並手工重新創建文檔模板(即樣式表)。這可以讓您獲得良好的代碼可讀性,更好的語義和更好的機會來分解類似文檔類型之間的常見元素。

相關問題