2009-12-23 103 views
53

pyyaml:傾銷沒有標籤

>>> import yaml 
>>> yaml.dump(u'abc') 
"!!python/unicode 'abc'\n" 

但我想

>>> import yaml 
>>> yaml.dump(u'abc', magic='something') 
'abc\n' 

什麼神奇的力量PARAM沒有標記?

回答

69

您可以使用safe_dump而不是dump。請記住,它將無法代表任意的Python對象。另外,如果您使用YAML load,則將獲得str對象而不是unicode

+0

safe_dump好像在最後強制使用'...',但這很容易修復 – 2009-12-23 23:55:26

+0

'dump_all'怎麼辦? – ATOzTOA 2013-02-13 09:21:44

+0

@ATOzTOA我不確定你在問什麼,但也有'safe_dump_all'。 – interjay 2013-02-13 10:21:02

13

如何:

def unicode_representer(dumper, uni): 
    node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni) 
    return node 

yaml.add_representer(unicode, unicode_representer) 

這似乎讓傾銷Unicode對象的工作一樣,我傾銷STR對象(Python的2.6)。

In [72]: yaml.dump(u'abc') 
Out[72]: 'abc\n...\n' 

In [73]: yaml.dump('abc') 
Out[73]: 'abc\n...\n' 

In [75]: yaml.dump(['abc']) 
Out[75]: '[abc]\n' 

In [76]: yaml.dump([u'abc']) 
Out[76]: '[abc]\n' 
+1

這適用於基本情況,但在某些情況下會混淆數據。另外,你應該在答案中提到函數在'yaml'上被調用,而不是在一個對象上。 – ATOzTOA 2013-02-13 09:20:58

3

你需要一個新的自卸車的類,它的一切標準自卸車類做,但覆蓋申述的STR和unicode。

from yaml.dumper import Dumper 
from yaml.representer import SafeRepresenter 

class KludgeDumper(Dumper): 
    pass 

KludgeDumper.add_representer(str, 
     SafeRepresenter.represent_str) 

KludgeDumper.add_representer(unicode, 
     SafeRepresenter.represent_unicode) 

導致

>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper) 
[abc, "abc\xE7"] 

>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper,encoding=None) 
[abc, "abc\xE7"] 

當然,我還是難倒如何保持這個漂亮。

>>> print u'abc\xe7' 
abcç 

並打碎了以後yaml.load()

>>> yy=yaml.load(yaml.dump(['abc','abc\xe7'],Dumper=KludgeDumper,encoding=None)) 
>>> yy 
['abc', 'abc\xe7'] 
>>> print yy[1] 
abc� 
>>> print u'abc\xe7' 
abcç 
0

我剛開始使用Python和YAML,但可能這也可能有幫助。只是比較輸出:

def test_dump(self): 
    print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True) 
    print yaml.dump_all([{'name': 'value'}, {'name2': 1}]) 
1

一點除了interjay的出色答卷,你可以保持在一個重裝你的unicode的,如果你把你的文件編碼的照顧。

# -*- coding: utf-8 -*- 
import yaml 
import codecs 

data = dict(key = u"abcç\U0001F511") 

fn = "test2.yaml" 
with codecs.open(fn, "w", encoding="utf-8") as fo: 
    yaml.safe_dump(data, fo) 

with codecs.open(fn, encoding="utf-8") as fi: 
    data2 = yaml.safe_load(fi) 

print ("data2:", data2, "type(data.key):", type(data2.get("key"))) 

print data2.get("key") 

test2.yaml內容在我的編輯器:

{key: "abc\xE7\uD83D\uDD11"}

打印輸出:

('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>) abcç

此外,閱讀http://nedbatchelder.com/blog/201302/war_is_peace.html後,我敢肯定,safe_load /無論如何,safe_dump就是我想要的地方。