2016-07-18 65 views
0

我在寫一個Python應用程序,需要從Google Drive獲取Google文檔作爲降價。如何將Google文檔作爲Markdown導入Python應用程序?

我正在尋找設計和現有開源代碼的想法。

據我所知,Google不提供導出爲降價。我想這意味着我必須弄清楚,哪種可用的下載/導出格式最適合轉換爲降價。

確保文檔內容不包含任何Markdown不支持的內容。

編輯:我想避免非python軟件保持設置儘可能簡單。

回答

1

您可能想看看支持轉換的Pandoc,即從docx到markdown。 Pandoc有幾個Python包裝器,例如pypandoc

在DOCX格式從谷歌獲取驅動器的文件後,轉換是非常簡單:

import pypandoc 
markdown_output = pypandoc.convert_file('Document.docx', 'markdown') 
+0

編輯的問題一點,渲染Pandoc一個不錯的選擇,因爲它不是純Python。我正在考慮使用https://github.com/mwilliamson/python-mammoth。 – Rubinous

1

谷歌驅動器提供了一個「拉鍊HTML」導出選項。

enter image description here

使用Python module html2text到HTML轉換成降價。

html2text是一個Python腳本,它將HTML頁面轉換爲清晰易讀的純ASCII文本。更好的是,該ASCII也恰好是有效的Markdown(文本到HTML格式)。

>>> import html2text 
>>> 
>>> print(html2text.html2text("<p><strong>Zed's</strong> dead baby, 
<em>Zed's</em> dead.</p>")) 
**Zed's** dead baby, _Zed's_ dead. 
相關問題