2010-11-19 99 views
9

我正在使用pisa,它是一個用於Python的HTML到PDF轉換庫。html to .doc轉換器在Python?

對於Word文檔是否存在相同的東西:一個HTML到.doc的Python轉換庫?

+0

你爲什麼要這樣? MS Word可以讀取HTML。 – MSalters 2010-11-19 15:08:53

+0

我有同樣的問題:我有一個使用比薩轉換爲PDF格式的HTML,我想用word來做同樣的事情。它是一個大的文檔,大約20頁,使用相同的代碼生成html,然後通過比薩或其他東西導出會很好。 – 2012-06-12 17:24:05

+0

@Eric:最近,我遇到了同樣的問題。只是想知道,你有沒有找到一個解決方案將HTML轉換爲Word .docx?謝謝。 – 2013-04-08 21:42:23

回答

3

雖然我不知道一個直接的模塊,可以讓你轉換這個的,但是:

  1. 您可以轉換HTML純文本首先使用html2text模塊。
  2. 之後,您可以使用此python-docx模塊將文本轉換爲docdocx文件。
9

你可以使用windows的pywin32 python擴展win32com,讓MS Word爲你轉換它。一個簡單的例子:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit()