我正在尋找將MS Word文件中的幾個段落和有序/無序列表轉換爲HTML的方式。將MS Word文本轉換爲普通有效的html/css
現在,問題是,當將Word文件保存爲「htm/html」類型的文件(我正在使用Word 2010)時,我得到了各種不需要的CSS指令的噸,其中一些是MS發明和一些是有效的CSS,我不想在我的HTML代碼。此外,甚至更有問題的是,有序/無序列表甚至沒有用LI項目編碼到OL和UL,而是編成瘋狂的Microsofty編碼。
例如,(設計爲「正常」字)一個段落轉換爲:
<p class=MsoNormal>
<span style='font-size:10.0pt;line-height:115%;mso-bidi-font-style:italic'>
bla bla </span></p>
而我只是希望它顯然是:
<p><span>bla bla</span></p>
更可怕的,一個簡單的雖然我希望得到
<p class=MsoListParagraph style='text-indent:-18.0pt;mso-list:l0 level1 lfo1'>
<![if !supportLists]>
<span style='font-family:Symbol;mso-fareast-font-family:Symbol;mso-bidi-font-family:Symbol'>
<span style='mso-list:Ignore'>·
<span style='font:7.0pt "Times New Roman"'>
</span></span></span><![endif]>
<span dir=LTR</span>Bla bla</p>
:unoredered列表(「項目符號列表」)與一個列表項被轉換爲
<ul><li>Bla bla</li></ul>
任何想法?
非常感謝!
p.s.我正在使用Zend Studio(也許有一個內置的eclipse/zend特定轉換器或其他東西?)
p.s.p.用於導出爲html的唯一MS Word選項位於Options => Advanced => General => Web Options中。玩這些選項並沒有解決任何上述問題。
複製代碼,然後將其粘貼到純文本編輯器中,如Sublime Text 2. –
@olwez謝謝,我會嘗試Sublime反正(雖然我看到它將來需要付費許可證),但我只是想出一個簡單的解決方案,我會把它寫成答案。 – Israel