2015-01-21 85 views
2

我很熟悉類似的問題,但他們似乎沒有解決什麼應該是一個簡單的問題。我正在使用Python 2.7x並嘗試讀取與此類似的YAML文件:如何在python中讀取yaml文件時跳過行?

%YAML:1.0 
radarData: !!opencv-matrix 
rows: 5 
cols: 2 
dt: u 
data: [0, 0, 0, 0, 0, 10, 5, 3, 1, 22] 

現在我只需要'data:'文檔。我嘗試了一種香草方法,然後嘗試強制跳過前四行(註釋掉的第二個代碼片段)。兩種方法都有錯誤。

import yaml 
stream = file('test_0x.yml', 'r') 
yaml.load(stream) 
# alternative code snippet 
# with open('test_0x.yml') as f: 
# stream = f.readlines()[4:] 
# yaml.load(stream) 

任何關於如何跳過前幾行的建議將非常感激。

回答

9

其實,你只需要跳過前兩行。

import yaml 

skip_lines = 2 
with open('test_0x.yml') as infile: 
    for i in range(skip_lines): 
     _ = infile.readline() 
    data = yaml.load(infile) 

>>> data 
{'dt': 'u', 'rows': 5, 'data': [0, 0, 0, 0, 0, 10, 5, 3, 1, 22], 'cols': 2} 
>>> data['data'] 
[0, 0, 0, 0, 0, 10, 5, 3, 1, 22] 

跳過前5行也可以。

+0

感謝雙方抽出時間,但@mhawke是正確的。 FWIW--數據文件的一次轉化有4個非yaml行。再次,謝謝! – Aengus 2015-01-21 11:09:00

+0

我身上的那個堅持者說要小心,把這些行稱爲「非YAML」。從長遠來看,如果您遇到很多我稱之爲「不太嚴格」的YAML,那麼建立預處理步驟可以使數據穩健地符合數據,而不是依賴數據中的鍵的順序。也就是說,不要修補沒有破壞的東西。 – spirulence 2015-01-21 16:54:37

1

我完全錯過了這裏的觀點,但我留下了我的原始答案在底部作爲一個謙卑的提醒。

mhawke的回答簡短而甜蜜,可能更可取。一個更復雜的解決方案:去除格式錯誤的指令,更正自定義標籤併爲其添加構造函數。這樣做的好處是無論出現在文件中的哪個位置都要糾正該標籤,而不僅僅是前幾行。

我在這裏的實現確實有一些缺點 - 它攪亂了整個文件,而且它還沒有在複雜的數據上進行過測試,用適當的替換標記的效果可能會與預期不同。

import yaml 

def strip_malformed_directive(yaml_file): 
    """ 
    Strip a malformed YAML directive from the top of a file. 

    Returns the slurped (!) file. 
    """ 
    lines = list(yaml_file) 
    first_line = lines[0] 
    if first_line.startswith('%') and ":" in first_line: 
     return "\n".join(lines[1:]) 
    else: 
     return "\n".join(lines) 


def convert_opencvmatrix_tag(yaml_events): 
    """ 
    Convert an erroneous custom tag, !!opencv-matrix, to the correct 
    !opencv-matrix, in a stream of YAML events. 
    """ 
    for event in yaml_events: 
     if hasattr(event, "tag") and event.tag == u"tag:yaml.org,2002:opencv-matrix": 
      event.tag = u"!opencv-matrix" 
     yield event 


yaml.add_constructor("!opencv-matrix", lambda loader, node: None) 
with open("test_0x.yml") as yaml_file: 
    directive_processed = strip_malformed_directive(yaml_file) 
    yaml_events = yaml.parse(directive_processed) 
    matrix_tag_converted = convert_opencvmatrix_tag(yaml_events) 
    fixed_document = yaml.emit(matrix_tag_converted) 

    data = yaml.load(fixed_document) 
    print data 

原來的答案

yaml.load功能你用回報的字典,它可以像這樣訪問:

import yaml 

with open("test_0x.yml") as yaml_file: 
    test_data = yaml.load(yaml_file) 

print test_data["data"] 

這是否幫助?

+0

我認爲你錯過了這一點,這是第2升ines不是有效的YAML,必須跳過。 – mhawke 2015-01-21 03:31:36

+0

你完全正確。好,趕快,謝謝。 – spirulence 2015-01-21 03:42:56

0

我已經aruco_calibration_fromimages.exe生成的攝像機矩陣,這裏是YML文件:

%YAML:1.0 
--- 
image_width: 4000 
image_height: 3000 
camera_matrix: !!opencv-matrix 
    rows: 3 
    cols: 3 
    dt: d 
    data: [ 3.1943912478853654e+03, 0., 1.9850941722590378e+03, 0., 
     3.2021356095317910e+03, 1.5509955246019449e+03, 0., 0., 1. ] 
distortion_coefficients: !!opencv-matrix 
    rows: 1 
    cols: 5 
    dt: d 
    data: [ 1.3952810090687282e-01, -3.8313647492178071e-01, 
     5.0555840762660396e-03, 2.3753464602670597e-03, 
     3.3952514744179502e-01 ] 

加載此陽明與此代碼:

import cv2 
fs = cv2.FileStorage("./calib_asus_chess/cam_calib_asus.yml", cv2.FILE_STORAGE_READ) 
fn = fs.getNode("camera_matrix") 
print(fn.mat()) 

而得到這樣的結果:

[[ 3.19439125e+03 0.00000000e+00 1.98509417e+03] 
[ 0.00000000e+00 3.20213561e+03 1.55099552e+03] 
[ 0.00000000e+00 0.00000000e+00 1.00000000e+00]] 
相關問題