使用records = pandas.read_json(path)
將JSON文檔導入到熊貓數據框中,其中path是JSON文檔的預定義路徑,我發現結果數據框「records」的某些列的內容不是預期的簡單字符串。相反,這樣的列中的每個「單元格」都是一個數組,其中包含一個單一元素 - 感興趣的字符串。這使得使用布爾索引來選擇列變得困難。例如,Ipython中的records[records['category']=='Python Books']
輸出一個空的數據框; 「單元格」包含字符串而不是字符串數組,輸出將是非空的,包含對應於Python書籍的行。我有單元素數組。我如何將它們自己更改爲元素?
我可以修改JSON文檔,以便「記錄」正確讀取字符串。但是有沒有辦法直接修改「記錄」,以某種方式將單元素數組自己剝離成元素?
聽起來? http://pandas.pydata.org/pandas-docs/stable/io.html#normalization(將有助於舉一個實際的例子:) :) –
謝謝安迪。我沒有嘗試json本身的規範化,但看起來我可以這樣做來解決問題。我會爲我的下一個json輸出嘗試。 – MichM