2013-10-15 38 views
0

問題:從其他網站隨機複製文本格式的最佳方式?

我的網站允許用戶複製/從其他文件粘貼內容/如MS Word和網站(例如CNN.com)到富文本編輯我們提供的文檔。這個Rick TextEditor支持(我們也必須支持)粘貼嵌入式樣式的內容,這帶來了隨機樣式,標籤內聯樣式的內容來源。

例如:如果您從任何MS Word文檔中粘貼,它帶來H1, H2, P, UL/OL/LI, STRONG, I, EM, TABLE等有自己的風格。當您從其他網頁複製粘貼時會發生同樣的情況。

如何格式化? 我要找來處理這些類型的用戶生成內容的格式的最好方式。首先,我需要保持複製的標籤不變。比方說,H1是從MS Word的用戶那裏得到的 - 我必須使用給定的企業品牌來保留這一風格。

的另一個問題是,當你複製/外來粘貼 - 有些標籤是不正確關閉 - 這使我的佈局休息。我們如何處理這個問題?

對於樣式,米施加

.article * { 
    allKnownCSSProperties: myValues!important; 
} 

任何方法會工作。 JavaScript,C#是首選。

回答

1

掉不想要的款式簡單的正則表達式就足夠了這個問題。在Javascript中:

/(style=['"][^'"]*['"])/g 
+0

這將刪除樣式屬性或清空那個? –

+0

它將匹配樣式屬性。你可以刪除它。在Javascript或C#中,相同的正則表達式大致相似。 – Pappa

+0

這是否有幫助? – Pappa

0

我想嘗試與缺乏封閉的標籤,因爲這需要解決的問題: 解析整個消息,並收集,這不是與/>結束標記,如果你發現同一個標籤與</開始刪除它們。排除可能沒有關閉標籤的標籤,爲尚在收藏中的所有標籤生成關閉標籤,並將它們放在您的Rich TextEditor佈局的末尾。它可能無法在某些情況下工作,或者看起來笨拙,但首先是進來的頭腦和它可能有助於解決

相關問題