我正在創建一個博客引擎,它包含一個輸入整篇文章的<textarea>
。將文檔從Word文檔複製到網頁時發生更改
然後我用Ajax和它存儲在GAE數據存儲
的問題提供了Text
變量:嵌入時 如果用戶複製從Word文檔中的文本,其中我看到屏幕上的各種隨機字符在網頁上。 我知道這是因爲這個詞文件使用XML編碼和HTML頁面使用UTF-8編碼(對我來說)
問題: 如何改變輸入的文本的編碼? 或者我該如何避免XML編碼? 或者如果改變我的網頁編碼可能有助於解決這個問題?
需要注意的事項: 我想使它自動化..我在Google上讀到,您應該首先將文本複製到一些簡單的文本編輯器,它將格式化編碼並將它們複製到網頁中。 但是這個選項對我來說是不可行的。
此外,我之前曾用過weebly,那時候我從一個word文件複製文本,如果有人知道如何管理編碼衝突的話會有多麼可怕!
答案有望在Java :)
您的上述代碼是否處理所有衝突?還是僅僅是一個例子?如果是,那麼我可以在哪裏獲得完整列表? – leo
很可能它會處理所有標準中不同的東西。給一個嘗試,讓我知道你的輸出 –
你只需要調用這個函數其餘的東西這個函數將做 –