2011-05-28 91 views
8

我與有問題,所以我的問題是: 當我粘貼到RichTextArea從Ms Word或OpenOffice的複製文本,它保留所有文本樣式,這是完美的,但一件壞事是它的HTML文本是巨大的足夠:( 和數據庫的大小,因爲不必要的HTML標籤的增加如何使用GWT優化從MS Word複製的HTML文本?

我的問題是:「如何輕鬆地優化該HTML文本?」

感謝!

回答

0

最後,我想出了我自己的問題的答案: 我發現TinyMCE for GWT對我來說足夠好,它具有ms選項的副本,並且其HTML優化非常好。

1

是基於瀏覽器的contentEditable的支持。這意味着您將要面臨的HTML「標籤湯」將會是平臺,源代碼和瀏覽器特定的。當你說「優化」你的最終目標是什麼?你想保存多少原始格式?除了簡單地縮小粘貼的HTML之外,任何HTML複雜度的顯着降低都可能導致視覺保真度的損失。

公用事業如HTML Tidy或其任何衍生工具可能可以幫助您縮小方面。如果您的目標是降低HTML的複雜性,您可以考慮使用HTMLUnit作爲捕獲的服務器端瀏覽器在內存中呈現粘貼的內容,然後從HTMLUnit的DOM中提取您認爲有用的屬性。 FWIW,這是讓搜索引擎抓取AJAX應用程序的一種方法。

雖然降低視覺保真度可能會對原始用戶有點不安,但它確實爲您提供了統一所有粘貼內容的視覺風格的機會。如果您基於來自許多用戶的貢獻來構建網站,則此同質性會減少定位所需的精力(即,請參閱您所看到的內容)內容。

相關問題