我正在尋找一種方式來HTML格式的文本轉換爲純文本,同時保持它的基本結構,也許會稍微調整了,所以:HTML轉換爲純文本,並保持基本格式
<p>This is a paragraph.</p>
<ol>
<li>List item 1.</li>
<li>List item 2.</li>
</ol>
<p>This is an <a href="www.google.com">anchor</a>.</p>
變爲:
這是一個段落。
- 列表項1.
- 列表項2.
這是一個錨(www.google.com)。
關於如何有效實現大量HTML格式模板的任何想法?
- 請注意,結構外最重要的部分是保持錨點。
您應該考慮使用降價或其他輕量級標記語言 – Nicolas
這是目前非選擇。我無權修改這些內容,但我需要以純文本的形式進行修改。 :/ – rebelliard
隨着[Pandoc(http://johnmacfarlane.net/pandoc/try)(哈斯克爾),你可以輕鬆地HTML源轉換爲標記語言。 – Nicolas