2011-12-07 15 views
12

爲什麼我要用Devel :: Peek :: Dump得到兩個不同的結果?哈希鍵編碼:爲什麼我在這裏得到Devel :: Peek :: Dump兩種不同的結果?

#!/usr/bin/env perl 
use warnings; 
use 5.014; 
use utf8; 
binmode STDOUT, ':encoding(utf-8)'; 
use Devel::Peek; 

my %hash1 = ('müller' => 1); 
say Dump $_ for keys %hash1; 

my %hash2; 
$hash2{'müller'} = 1; 
say Dump $_ for keys %hash2; 

輸出:

SV = PV(0x753270) at 0x76d230 
    REFCNT = 2 
    FLAGS = (POK,pPOK,UTF8) 
    PV = 0x759750 "m\303\274ller"\0 [UTF8 "m\x{fc}ller"] 
    CUR = 7 
    LEN = 8 

SV = PV(0x753270) at 0x7d75a8 
    REFCNT = 2 
    FLAGS = (POK,FAKE,READONLY,pPOK) 
    PV = 0x799110 "m\374ller" 
    CUR = 6 
    LEN = 0 
+0

是否確定來源有兩個密鑰完全一樣的字節? – Mat

+0

這兩個'ü'都使用keyboad的'ü'鍵寫入。 –

+0

順便說一句,'說轉儲...;'應該'轉儲......;'。 – ikegami

回答

4

這兩項標量的包含完全相同的字符串。唯一的區別僅在於字符串如何存儲在內部。

我的猜測是,關鍵是標準化試圖找到哈希鍵時,方便做比較。

+0

我試圖用hash從'XML :: LibXML'編寫'xml'文件。當我在'$ hash {key} ...'模式中寫入散列條目時,我收到錯誤消息並且腳本消失:<錯誤:字符串不是UTF-8 編碼錯誤:輸出轉換由於conv錯誤,字節0xFC有0x6C 0x6C 0x65 I/O錯誤:<?XML版本= 「1.0」 編碼= 「ISO-8859-1」>編碼器錯誤 <作者author =「米> –

+0

@sid_com ,這裏不是提出新問題的地方,你的問題是非常不清楚的,請將它發佈到適當的位置,並提供一個最小的,可運行的問題演示。 – ikegami

+0

打開一個新問題:http://stackoverflow.com/questions/8443863/getting-encoding-error-when-using-hash-keys-to-write-xml-files-with-xmllibxml –

1

這不是一個答案,我相信池上的反應是正確的。我只是想用一些代碼添加一些觀察。

我跑到下面的代碼通過5.10 5.15和行爲是一致的。

use utf8; 
use Test::More; 

{ 
    my %h = ('müller' => 1); 
    my $k = (keys %h)[0]; 
    ok(utf8::is_utf8($k), 'UTF-8 Latin-1 hash key has SvUTF8 set'); 
} 

{ 
    my %h = ('müller' => 1); 
     $h{'müller'} = 2; 
    my $k = (keys %h)[0]; 
    ok(! utf8::is_utf8($k), 'UTF-8 Latin-1 hash key does not has SvUTF8 set after assignment'); 
} 

{ 
    my %h = ('☺' => 1); 
     $h{'☺'} = 2; 
    my $k = (keys %h)[0]; 
    ok(utf8::is_utf8($k), 'UTF-8 (> Latin-1) hash key has SvUTF8 set after assignment'); 
} 

done_testing; 

如果預計進行第二次測試,這將是我所知道的第一次無聲降級。我猜p5p最終的答案是否這是一個優化錯誤或預期的行爲。 (sv_dump看起來像一個優化(POK,假的,只讀的,pPOK))

相關問題