我正在開發一個數據挖掘項目。我需要從屬於亞馬遜的json格式數據集中讀取數據。
數據集的格式是這樣的:
首先,我要提取這些行:
[產品名稱],[評分]
此後,我想寫的行與兩列的csv文件命名作爲產品名稱和評級。有任何方法可以通過使用熊貓庫來實現這一點嗎?如何從json文件中讀取數據並使用pandas將其轉換爲csv?
回答
對於數據子集,我已將其轉換爲DF。請注意,您擁有的數據不是json格式的數據。
import pandas as pd
import json
from collections import defaultdict
import re
f=open('inv.json')
text= f.readlines()
RowID=[]
result={}
for item in text:
if item.startswith("###"):
RowID=re.findall('\d+', item)
result[RowID[0]]={}
elif ":" in item:
key,value =item.split(":",1)
result[RowID[0]][key.strip()]=value.strip()
df= pd.DataFrame(result)
print df.transpose()
樣品輸入
#####1
[ID]:0
[ProductId]:0
[rating]:2.0
#####2
[ID]:1
[ProductId]:2
[rating]:3.0
[fullText]:It is a good
[weburl]:http://example.org:xx
輸出
[ID] [ProductId] [fullText] [rating] [weburl]
1 0 0 NaN 2.0 NaN
2 1 2 It is a good 3.0 http://example.org:xx
我試過你開發的代碼。不幸的是,它會給出錯誤。 ValueError:需要解壓縮的值太多(文件「C:\ Users \ masoud \ Desktop \ Dataset \ data3 \ aa - Copy.py」,第16行,在
更新了答案,我們期望OP有最低工作投入和預期產出的原因。 – Shijo
工作!謝謝Shiju。你很棒 –
- 1. 使用bash提取數字並將其轉換爲CSV文件
- 2. 下載JSON數據並使用Python將其轉換爲CSV
- 3. 如何從URL獲取數據並將其轉換爲json?
- 4. 如何從JSON獲取數據並將其轉換爲對象?
- 5. 量角器將CSV文件轉換爲Json並讀取鍵值
- 6. 從CSV文件讀取行並將其導出爲JSON
- 7. 從文件中讀取文本並將其轉換爲UTF32
- 8. 如何讀取csv文件並將其轉換爲javascript中的對象
- 9. 如何從url獲取csv並將其轉換爲數組
- 10. 如何將.txt文件轉換爲jar並將其讀取
- 11. 如何使用Jena從HDFS讀取文件並將其轉換爲Rdf?
- 12. 從文件中讀取字符串並將其轉換爲int
- 13. 使用字符串輸入讀取csv文件並將其轉換爲列表
- 14. 如何從Mysql數據庫中抓取2列數據並將其轉換爲csv文件
- 15. 無法從數據庫中提取數據並將其轉換爲Json數據
- 16. 如何使用Python讀取txt文件中的數據塊並將其轉換爲結構化數據?
- 17. 從csv文件中讀取數據並轉換爲熊貓的時間序列
- 18. 如何從指紋閱讀器讀取數據並將其轉換爲java中的圖像文件
- 19. 如何使用Scala將普通類轉換爲JSON並將其轉換爲JSON?
- 20. 從CSV文件中讀取數據後,將字符串轉換爲int
- 21. 如何從csv文件讀取數據並將數據插入html文件
- 22. 如何使用Jackson將javafx.scene.paint.Color轉換爲JSON並從中轉換
- 23. 從文本文件讀取指數數字並將其轉換爲INT64在vC++
- 24. 從Blob存儲中讀取PDF並將其轉換爲文本
- 25. 如何使用Python將JSON(Twitter數據)轉換爲CSV
- 26. 如何從csv文件讀取特定數據並將其刪除?
- 27. 如何從csv文件讀取數據
- 28. 如何使用Node.js將CSV文件轉換爲JSON腳本?
- 29. 如何使用python將大型Json文件轉換爲csv
- 30. 如何從csv文件讀取數據並將其存儲在我的數據庫文件中的sqlite中?
文件不JSON – Backtrack
你可以添加'json'作爲文本的樣本? – jezrael
還檢查json是否有效 - http://jsonlint.com/ – jezrael