我有從webscraping微博在記事本中打開JSON一些JSON數據之後稍微改變++示出此示例關鍵值對:python3:JSON數據被讀取
"id_str": "823962574509248514",
但在JSON讀取後(我有兩種方式如下圖):
filename = "../TheTweets/data/short.json"
columnName = ['id_str','created_at', 'full_text','in_reply_to_status_id']
data = pd.read_json(filename, orient=columnName)
#data = pd.DataFrame(pd.read_json(filename, orient=columnName,encoding="utf-8"),columns=columnName)
我注意到ID_STR數量變化:
"id_str":823962574509248512, (looks like the last number)
運行後打印(data.dtypes),我看到id_str是int64
我不太明白髮生了什麼,它似乎是一個很大的問題,如果ids不匹配了(我繼續保存數據回到一個新的JSON中,並在記事本++中進行比較)。我不太清楚這是什麼影響,如果我有成千上萬的行
奇怪的值改變,但特別是從字符串到數字的類型改變! – Indent
@Indent我正在考慮如何在read_json過程中指定dtypes – user3120554
您是否嘗試過'json_normalize'? –