我正在從文件中讀取JSON字符串,解析它,然後將數據插入MySQL數據庫。我插入查詢拋出以下錯誤:文件讀取到數據庫插入導致unicode字符串
SQLSTATE[HY000]: General error: 1366 Incorrect string value: '\xE3\xADs' for column 'fname' at row 1
我相信導致錯誤的內容是在名稱Ailís
(我呼應的ID,直到錯誤被拋出)的í
。
- 該文件是UTF8使用UTF8上下文
- 我檢查的數據的編碼是UTF8(它是)
- 我的PDO連接具有UTF8編碼
- 我讀該文件字符集,以及
SET NAMES utf8
- 該數據庫是UTF8編碼
- 該表是UTF8編碼
- 列是UTF8編碼
代碼:
$opts = ['http' => ['header' => 'Accept-Charset: UTF-8, *;q=0']];
$context = stream_context_create($opts);
$post = file_get_contents('sample_data/11111a_json_upload.json',false, $context);
if(!mb_check_encoding($post, 'UTF-8'))
throw new Exception('Invalid encoding detected.');
$data = json_decode($post, true);
我還插入下面的函數之前,我解碼的JSON:
static function clean_unicode_literals($string)
{
return preg_replace_callback('@\\\(x)?([0-9a-zA-Z]{2,3})@',
function ($m) {
if ($m[1]) {
$hex = substr($m[2], 0, 2);
$unhex = chr(hexdec($hex));
if (strlen($m[2]) > 2) {
$unhex .= substr($m[2], 2);
}
return $unhex;
} else {
return chr(octdec($m[2]));
}
}, $string);
}
當我讀到的原始文件,當我解析的數據回顯到瀏覽器,名稱顯示正確。因此,我認爲這個問題與我有關?
我創建了一個新的PDO實例,像這樣:
public function __construct($db_user, $db_pass, $db_name, $db_host, $charset)
{
if(!is_null($db_name))
$dsn = 'mysql:host=' . $db_host . ';dbname=' . $db_name . ';charset=' . $charset;
else
$dsn = 'mysql:host=' . $db_host . ';charset=' . $charset;
$options = [
PDO::ATTR_PERSISTENT => true,
PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION,
PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES 'utf8'"
];
try
{
$this->db_handler = new PDO($dsn, $db_user, $db_pass, $options);
$this->db_handler->exec('SET NAMES utf8');
$this->db_valid = true;
}
catch(PDOException $e)
{
$this->db_error = $e->getMessage();
$this->db_valid = false;
}
return $this->db_valid;
}
(SET NAMES有兩次我排除故障......)
數據庫,表和列字符集設置爲utf8_general_ci
。
我的IDE是PHPStorm,而我在Windows上運行WAMP的MySQL 5.7.14 10
那麼實際上插入的代碼在哪裏? – Sammitch