2014-03-03 225 views
3

我有一個包含嵌入HTML內容的XML文檔,我試圖將其轉換爲RTF輸出文件。我有用<li>, <p>, <b>和其他HTML標記修飾的XML元素,我想將它們轉移到生成的RTF中。將HTML標記轉換爲RTF文檔

這裏是什麼工作,截至目前:

  1. 獲取XML標籤內容爲字符串(包含換行,段落標記,並列出HTML標籤)
  2. 編寫XML標籤內容到RTF文件。

我正在使用Python腳本來實現轉換。另外使用的是ElementTree(解析輸入XML)PyRTF-NG(用於將HTML轉換爲RTF),一個處理表格和其他特殊格式的庫。目前,除了HTML的「降價」(即將HTML格式標籤轉換爲實際的RTF格式)之外,我已經成功地獲得了我需要的所有內容。爲了澄清,我的意思是,如果我的RTF轉換器遇到<ol><li>標籤,它應該在RTF中創建一個有序列表,而不是將<ol><li>標籤分發到RTF中。

有誰知道Python是否有任何本地調用,這將允許我這樣做,或任何其他Python庫,可能有我需要完成全面轉換爲RTF。

謝謝!

回答