2017-08-31 50 views
-3

使用Python和熊貓我要實現以下目標:導入文件,並轉換過大熊貓

我有以下文件格式約600 JSON文件:

User Name: ǝuuǝıɹpɐ\nAll Tags: Delightful Followers\t|\tlibtards\t........|\tExpressionEngine\t|\t\nYour Tag: 

我想創建一個大熊貓數據幀所有文件,並讓它看起來像這樣

User name  All Tags          Your tag 
ǝuuǝıɹpɐ  Delightful Followers\t|\tlibtards\t.... 
.    .       
.    . 

我嘗試usign下面的代碼:

data = pd.read_csv('D:/datasets/edx1/word_cloud/557563.json', sep="\n", header=None) 

這給了我下面的數據幀

0 User Name: ǝuuǝıɹpɐ 
1 All Tags: Delightful Followers\t|\tlibtards\t|... 
2 Your Tag: 

還林不知道爲什麼JSON文件看起來它的方式,網上閱讀它說,JSON文件是字典,但它似乎沒有在這裏是如此。

回答

1

1)通過對輸入目錄使用os.listdir()遍歷文件,例如:docs

2)爲每個文件,open(具體步驟取決於您的PY版本),並使用該文件轉換成一個Python字典json.load()來自json模塊,docs。這會將json變成標準dict。 3)您可以使用from_dict()docs將這些字典轉換爲熊貓DataFrame

+0

我不認爲它是'json'格式,請看一下這個問題中的例子。 – sKwa

+0

是的,所以文件類型說它的json,但格式根本不相似,我一直使用open('filename')來導入它們。 –

+0

@sKwa當然。我沒有仔細看過它。好決定。 – patrick