MSWORD文檔中的文本,當您剪切和粘貼一個Word文檔到文檔HTMT(具體爲contenteditable
格)我注意到它包含了很多的元數據。我感興趣的是一個JavaScript函數,可以將這些文本分頁成多個div,因爲它們是word文檔中的「頁面」。分頁與JavaScript
如果你不熟悉,這裏的word文檔的樣子從查看源代碼的縮寫版本:
<div contenteditable="true" >
<!--[if gte mso 9]><xml>
<o:OfficeDocumentSettings>
<o:AllowPNG/>
</o:OfficeDocumentSettings>
</xml><![endif]-->
<!--lots more junk until get to actual content which is here:-->
<p class="Default">
<b><span style="font-size:14.0pt;font-family:Arial;color:windowtext">
I am the actual title of this work. <o:p></o:p></span>
</b>
</p>
謝謝,是的解決方案可能是基於字符數或一些元數據標籤,不知道... –
嗨@LukeGT,感謝您的進一步解釋,我想我的概念理解,而不是代碼的外觀,你可以對此採取一些措施嗎? –
當然,看看我的編輯快速模擬 – LukeGT