2008-12-09 19 views
0

我有一些從CSV文件插入MySQL數據庫的HTML,而該文件又是從訪問MDB文件導出的。 MDB文件被導出爲Unicode,實際上是Unicode。然而,我不確定是什麼編碼MySQL數據庫。轉換用於MySQL和JSON的unicode

但是,當我嘗試回顯存儲在字段中的html時,沒有Unicode。這是直接檢索數據庫中的一個html字段。

http://www.yousendit.com/download/TTZueEVYQzMrV3hMWEE9PQ

它說,在源utf-8。從呼應出article_desc實際產生的頁面代碼是在這裏:

http://www.nomorepasting.com/getpaste.php?pasteid=22566

我需要使用這個網站使用JSON,我想知道我應該做的。我不能使用任何其他框架或庫。我應該在將數據插入MySQL DB之前轉換數據還是其他?

回答

2

該mdb文件導出爲Unicode,實際上是unocode。

這沒有任何意義。一個文件不能是unicode。它可以用Unicode或UTF-8編碼,如utf-8或utf-16與BOM或..

字符集問題是一個非常普遍的問題,它的根源在於無知。我不會說這會冒犯你,但你確實需要知道代碼點(字符串)和編碼(字節流)之間的區別。如果您不知道在整個應用程序中始終處理的是哪個問題,則最終會出現問題。關於這些問題的詛咒是,它們只發生在邊緣案例中,所以長期監督它們很容易,並且當您最終意識到某些錯誤時,它可能會在應用程序的完全不相關的部分中觸發。這使得幾乎不可能進行調試。