2012-05-02 28 views
1

我最近工作的一個站點有一個與數據庫有關的問題,顯然當它們恢復表中任何帶有奇怪符號的文本字段時,半符號和度符號)文本字段停在該符號之前的字符處)。我有表的副本和蒸餾水它歸結爲下面的代碼:MySQL無法從備份恢復表 - #1366 - 錯誤的字符串值

CREATE TABLE `products2` (
     `id` int(10) unsigned NOT NULL AUTO_INCREMENT, 
     `description` text CHARACTER SET utf8 COLLATE utf8_bin NOT NULL, 
     PRIMARY KEY (`id`) 
    ) DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci; 


    insert into products2 values 
(25, 0x

這將引發一個錯誤:

#1366 - Incorrect string value: '\xBD Digi...' for column 'description' at row 1 

展望計算器上和網絡上這個問題似乎是編碼的問題,我試着將描述字段上的排序規則更改爲utf_unicode_ci,並將表格整理爲utf_bin(以及所有這些組合)都無濟於事。

我無法重做轉儲,因爲它是備份。我不明白系統如何輸出轉儲但不接受它 - 大概備份是通過命令行(不確定),我使用PHPMyAdmin來恢復它,我不知道這是否有所作爲。

如果無法導入數據,我將不勝感激,如果有人能告訴我如何將編碼數據讀入文本,然後我可以手動剪切和粘貼。

回答

5

解碼所述第一32個字節ASCII,我們有(其中?0xBD字節有關哪些MySQL的抱怨):

 
The DPM 912 is a large 3? Digit 

谷歌搜索「DPM 912」的一點點suggests to me該字符應低俗的一半部分,½。

A number of character sets編碼尤其是性格與字節0xBD,但一個跳了出來:windows-1252 —這不僅在(預Unicode)的Windows世界中的默認代碼頁,但也MySQL's default encoding。這是一個很好的猜測,你的數據編碼在windows-1252

the MySQL manual解釋,你可以指定一個字符串的通過與編碼名稱前綴它字面的編碼:

A character string literal may have an optional character set introducer and COLLATE clause:

[_charset_name]'string' [COLLATE collation_name]

它接着說:

An introducer is also legal before standard hex literal and numeric hex literal notation (x'literal' and 0xnnnn), or before bit-field literal notation (b'literal' and 0bnnnn).

因此(因爲MySQL是指windows-1252latin1),您可以將您的INSERT命令更改爲:

INSERT INTO products2 VALUES (25, _latin1 0x5468652044504D203931322069...); 

的文件也指出:

For the simple statement SELECT 'string' , the string has the character set and collation defined by the character_set_connection and collation_connection system variables.

也就是說,如果省略了這樣的導引(因爲它是在原來的INSERT聲明),字符集被認爲是由character_set_connection系統變量定義。

如前所述here,也有設定該變量(包括由當你的客戶機連接,其在成功運行,設置與[DefaultCharset]配置選項,該選項的默認是latin1之前V3指定它的方式編號。4,但一直是utf8因爲 - 也許這種變化是你問題的根源;也可以用[Import][charset]指定導入文件的字符集)。如果在連接時未指定所需的字符集,則在連接後但在您的INSERT命令將修復它之前(例如,可以將其中一個添加到轉儲文件的頂部)發出以下任何命令:

SET NAMES 'latin1'; 
SET CHARACTER SET latin1; 
SET character_set_connection = latin1; 

我的建議,使轉儲文件儘可能便攜,將其添加到頂部SET NAMES 'latin1'

+0

謝謝,我將表格列更改爲latin1_bin和表格整理,並修復它。 –