我想使用Python將docx文件的內容(文本,圖像,鏈接)轉換爲.chm文件。任何人都可以請建議如何做。如何使用Python將docx文件轉換爲.chm
我試圖用docx2txt
https://github.com/ankushshah89/python-docx2txt包讀取docx文件內容。但我不確定如何閱讀文件中的圖像和鏈接。 有人可以請建議如何分別讀取每個內容並將其轉換爲.chm文件。
我想使用Python將docx文件的內容(文本,圖像,鏈接)轉換爲.chm文件。任何人都可以請建議如何做。如何使用Python將docx文件轉換爲.chm
我試圖用docx2txt
https://github.com/ankushshah89/python-docx2txt包讀取docx文件內容。但我不確定如何閱讀文件中的圖像和鏈接。 有人可以請建議如何分別讀取每個內容並將其轉換爲.chm文件。
你可能會警告這有一個學習曲線。
您需要將Word文檔中的所有部分提取到乾淨的HTML文件中,包括圖形文件。請致電Save Word as HTML。但是我認爲這不會讓HTML變得乾淨。
您需要Microsoft Htmlhelp編譯器來創建Chm文件。我建議爲您的任務使用轉換工具或幫助創作工具(Hat)。
谷歌搜索此工具「DoctoChm」,並嘗試您的需求。
我最近需要將一些簡歷轉換爲純文本。想要從二進制格式中提取可讀文本有許多用例。