2013-07-24 105 views
5

我正在尋找將MS Word文件中的幾個段落和有序/無序列表轉換爲HTML的方式。將MS Word文本轉換爲普通有效的html/css

現在,問題是,當將Word文件保存爲「htm/html」類型的文件(我正在使用Word 2010)時,我得到了各種不需要的CSS指令的,其中一些是MS發明和一些是有效的CSS,我不想在我的HTML代碼。此外,甚至更有問題的是,有序/無序列表甚至沒有用LI項目編碼到OL和UL,而是編成瘋狂的Microsofty編碼。

例如,(設計爲「正常」字)一個段落轉換爲:

<p class=MsoNormal> 
<span style='font-size:10.0pt;line-height:115%;mso-bidi-font-style:italic'> 
    bla bla </span></p> 

而我只是希望它顯然是:

<p><span>bla bla</span></p> 

更可怕的,一個簡單的雖然我希望得到

<p class=MsoListParagraph style='text-indent:-18.0pt;mso-list:l0 level1 lfo1'> 
<![if !supportLists]> 
    <span style='font-family:Symbol;mso-fareast-font-family:Symbol;mso-bidi-font-family:Symbol'> 
    <span style='mso-list:Ignore'>· 
    <span style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 

    </span></span></span><![endif]> 
<span dir=LTR</span>Bla bla</p> 

:unoredered列表(「項目符號列表」)與一個列表項被轉換爲

<ul><li>Bla bla</li></ul> 

任何想法?

非常感謝!

p.s.我正在使用Zend Studio(也許有一個內置的eclipse/zend特定轉換器或其他東西?)
p.s.p.用於導出爲html的唯一MS Word選項位於Options => Advanced => General => Web Options中。玩這些選項並沒有解決任何上述問題。

+0

複製代碼,然後將其粘貼到純文本編輯器中,如Sublime Text 2. –

+0

@olwez謝謝,我會嘗試Sublime反正(雖然我看到它將來需要付費許可證),但我只是想出一個簡單的解決方案,我會把它寫成答案。 – Israel

回答

6

好吧,發現了一個奇怪的,但工作液:

使用http://htmleditor.in/index.html和 「粘貼從Word」 選項,做到這一點使用(諷刺!)的Internet Explorer(IE瀏覽9測試)。

原因是,當我用Chrome瀏覽器的工作,在按下「從Word粘貼」,一個HTML DIV型彈出來問我的權限直接訪問我的剪貼板數據,並粘貼有使用CTRL時-v文本,根據需要,結果是缺少子彈(項目符號被轉換爲段落)。

相反,當我用IE 9,而不是DIV型彈出,我得到一個IE系統型彈出,並粘貼有保留子彈......

諷刺這是爲了解決從微軟開始的一個問題,我使用了另一個微軟產品,這可能是因爲它的html兼容性差,這正是我想要的......大聲笑。

+0

這真棒! – JaseC

+0

我有一個類似的問題,這是一個偉大的工作! –

+0

這仍然有效。謝謝 – Advancin