我想使用python熊貓來閱讀json文件。該文件的每一行都是JSON中的完整對象。如何閱讀使用Python熊貓的json文件?
我用下面版本 -
蟒蛇:2.7.6
大熊貓:1.19.1
JSON文件 -
{"id":"111","p_id":"55","name":"aaa","notes":"","childs":[]}
{"id":"222","p_id":"56","name":"bbb","notes":"","childs":[]}
{"id":"333","p_id":"75","name":"ccc","notes":"","childs":[]}
{"id":"444","p_id":"76","name":"ddd","notes":"","childs":["abc","efg","pqr"
,"rtu"]}
我使用下面的代碼讀取json文件 -
df = pd.read_json("temp.txt", lines = True)
print df
問題是,在json文件中,「childs」鍵包含一個未知索引數組,在「\ n」之間可用。所以如果我運行上面的代碼,我得到ValueError:預期的對象或值但如果我刪除「\ n」之後「pqr」可用我的代碼得到工作。
我不想從我的數據中刪除可用的「\ n」。我想在我的代碼中處理這個問題。我想只使用python熊貓而不是python json庫以良好的方式處理數據。
我如何才能利用python熊貓並處理這種類型的文件?
以字符串形式讀取整個文件,並用新行分割,然後你有4個json字符串,你可以簡單地解析。 –
@ErikŠťastný-好吧,但我怎麼可以維持熊貓數據框中的數據後,吐出新的線? – kit
使json文件的每一行都成爲一個有效的json,是一種更好的方法 – pktangyue