2012-05-02 28 views
1

我最近工作的一個站點有一個與數據庫有關的問題,顯然當它們恢復表中任何帶有奇怪符號的文本字段時,半符號和度符號)文本字段停在該符號之前的字符處)。我有表的副本和蒸餾水它歸結爲下面的代碼:MySQL無法從備份恢復表 - #1366 - 錯誤的字符串值

CREATE TABLE `products2` (
     `id` int(10) unsigned NOT NULL AUTO_INCREMENT, 
     `description` text CHARACTER SET utf8 COLLATE utf8_bin NOT NULL, 
     PRIMARY KEY (`id`) 
    ) DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci; 


    insert into products2 values 
(25, 0x5468652044504D203931322069732061206C617267652033BD204469676974204C434420566F6C746D657465722E20546865207369676E616C206265696E67206D6561737572656420697320616C736F207573656420746F20706F77657220746865206D657465722C20696E636C7564696E6720746865206261636B6C696768742E20546865206D657465722066656174757265732061203320746F20363056206D6561737572656D656E742072616E67652C20776974682061207265736F6C7574696F6E206F662031306D56206265747765656E20332E303020616E642031392E39395620616E64203130306D56206265747765656E2032302E3020616E642036302E30562E205768656E2074686520766F6C746167652064726F70732062656C6F772033562C204C4F20697320646973706C617965642028646F776E20746F20322E38562C207768656E2074686520646973706C61792077696C6C207475726E206F6666292E209148499220697320646973706C61796564207768656E2074686520766F6C7461676520676F65732061626F7665203630562E0D0A0D0A5363726577207465726D696E616C7320616C6C6F7720666F7220717569636B20616E64206561737920636F6E6E656374696F6E2E20546865206D6574657220697320686F7573656420696E206120726F6275737420636172726965722077686963682063616E20626520626F6C74656420696E20706C616365206F722070616E656C206D6F756E746564207573696E6720746865206C6F772070726F6669206C652062657A656C20616E6420636C6970732070726F76696465642E20416E2049503637202F204E454D412034582062657A656C20697320616C736F20617661696C61626C6520666F722070726F74656374696F6E20616761696E7374206475737420616E64206D6F6973747572652E0D0A0D0A417320746869732069732061206E65772064657369676E2077652073756767657374207468617420796F7520636F6E74616374204C617363617220666F7220757020746F2064617465206C6561642D74696D6520696E666F726D6174696F6E206265666F7265206F72646572696E67206F6E6C696E652E0D0A) 

這將引發一個錯誤:

#1366 - Incorrect string value: '\xBD Digi...' for column 'description' at row 1 

展望計算器上和網絡上這個問題似乎是編碼的問題,我試着將描述字段上的排序規則更改爲utf_unicode_ci,並將表格整理爲utf_bin(以及所有這些組合)都無濟於事。

我無法重做轉儲,因爲它是備份。我不明白系統如何輸出轉儲但不接受它 - 大概備份是通過命令行(不確定),我使用PHPMyAdmin來恢復它,我不知道這是否有所作爲。

如果無法導入數據,我將不勝感激,如果有人能告訴我如何將編碼數據讀入文本,然後我可以手動剪切和粘貼。

回答

5

解碼所述第一32個字節ASCII,我們有(其中?0xBD字節有關哪些MySQL的抱怨):

 
The DPM 912 is a large 3? Digit 

谷歌搜索「DPM 912」的一點點suggests to me該字符應低俗的一半部分,½。

A number of character sets編碼尤其是性格與字節0xBD,但一個跳了出來:windows-1252 —這不僅在(預Unicode)的Windows世界中的默認代碼頁,但也MySQL's default encoding。這是一個很好的猜測,你的數據編碼在windows-1252

the MySQL manual解釋,你可以指定一個字符串的通過與編碼名稱前綴它字面的編碼:

A character string literal may have an optional character set introducer and COLLATE clause:

[_charset_name]'string' [COLLATE collation_name]

它接着說:

An introducer is also legal before standard hex literal and numeric hex literal notation (x'literal' and 0xnnnn), or before bit-field literal notation (b'literal' and 0bnnnn).

因此(因爲MySQL是指windows-1252latin1),您可以將您的INSERT命令更改爲:

INSERT INTO products2 VALUES (25, _latin1 0x5468652044504D203931322069...); 

的文件也指出:

For the simple statement SELECT 'string' , the string has the character set and collation defined by the character_set_connection and collation_connection system variables.

也就是說,如果省略了這樣的導引(因爲它是在原來的INSERT聲明),字符集被認爲是由character_set_connection系統變量定義。

如前所述here,也有設定該變量(包括由當你的客戶機連接,其在成功運行,設置與[DefaultCharset]配置選項,該選項的默認是latin1之前V3指定它的方式編號。4,但一直是utf8因爲 - 也許這種變化是你問題的根源;也可以用[Import][charset]指定導入文件的字符集)。如果在連接時未指定所需的字符集,則在連接後但在您的INSERT命令將修復它之前(例如,可以將其中一個添加到轉儲文件的頂部)發出以下任何命令:

SET NAMES 'latin1'; 
SET CHARACTER SET latin1; 
SET character_set_connection = latin1; 

我的建議,使轉儲文件儘可能便攜,將其添加到頂部SET NAMES 'latin1'

+0

謝謝,我將表格列更改爲latin1_bin和表格整理,並修復它。 –