我需要將HTML文檔(從DocBook XML文檔生成)轉換爲Wiki標記語言,特別是標記爲PM Wiki的語言。目標是在我們新創建的wiki中包含公司的應用操作指南。這意味着,我其實有兩個選擇:將XML或HTML轉換爲Wiki標記 - 您會選擇哪種方法?
- 轉換(從DocBook個XML生成)到維基
- 轉換DocBook的個XML直接到維基
的HTMLS由於HTMLS由一個DocBook產生到HTML轉換器,標籤在HTML文檔中定義的方式差別不大,只有文檔的內容。
我正在尋找可以由我自己快速實施的解決方案。我將不得不一次完成此轉換,然後每次創建應用程序操作指南的新版本時。我已經想到了到目前爲止
解決方案:
- 轉換HTML用Perl或PHP腳本,維基,基於正則表達式。
- 將Docbook XML直接轉換爲wiki。由於它是XML,所以我可以使用Java進行XML解析。這裏面的風險是我不熟悉DocBooks XML格式(就像我使用HTML),所以這需要一些時間來學習。
你會選擇什麼方法進行這項工作?
更新:
我只是嘗試了PmWiki的擴展名爲ConvertHTML。它沒有正常工作,因爲它不轉換HTML標籤(例如沒有像在wiki中那樣轉換),如其文檔所述:
PmWiki標記不支持所有的HTML標記,所以100 %轉換是不可能的。但是,PmWiki可以在編輯或保存文本時替換文本。 ConvertHTML實現了一套相對全面的將HTML標籤轉換爲wiki標記的規則。
XML是爲交換數據 - 因此將XML轉換爲HTML,然後解析HTML是一種無感。 因此,對於直接XML解析來說,+1會容易得多。 – user181750 2009-10-29 12:13:40
@rebugger,它不一定會更容易,因爲XML到HTML轉換器是我們已經擁有的東西。 – 2009-10-30 09:04:39