我試圖將單個HTML代碼轉換爲* .odt格式(Open Office)正在使用的XML格式。例如,<p>This is some text</p>
應翻譯爲<text:p>This is some text</text:p>
。當然,這也應該與列表等HTML到ODT - XSLT?
我不確定是否最好的方式去使用XSLT處理器(如果是這樣,哪一個用於Java?)並自己創建樣式表 - isn那裏有一個Java庫可以做到這一點嗎? 我使用jodconverter從ODT-> PDF,但即使OpenOffice Writer可以處理複製&粘貼內容並以期望的方式顯示,但jodconvert似乎無法「翻譯」單個HTML片段(或者我錯了嗎?)。
任何意見和建議將是非常受歡迎的。我應該補充一點,我對Java絕對陌生。在此先感謝 Ingo
HTML or XHTML? XSLT僅適用於XML,HTML不適用於XML。 – Joe
謝謝。我實際上是在討論HTML,但即使HTML本身不是XML,也應該可以「整理」它使其起作用(如Askolein的帖子的鏈接所述)。 –
是的,在某些情況下,可以將HTML整理爲XML。但並不總是如果HTML格式不正確。 – Joe