2014-05-22 123 views
0

我試圖將Google電子表格中的數據導入pandas進行分析。我有幾個數據集在一張紙上,所以我不能使用導入如下所示的CSV例如:Getting Google Spreadsheet CSV into A Pandas Dataframe將Google電子表格數據導入熊貓數據框

這是我的數據看起來像在電子表格:

Date  letters numbers mixed 
1/1/2014 a   3  z1 
1/2/2014 b   2  y2 
1/3/2014 c   1  x3 

我已經使用gspread來進口和可以得到的數據是這樣的,每行一個觀察:

[['Date', 'letters', 'numbers', 'mixed'], ['1/1/2014', 'a', '3', 'z1'], ['1/2/2014', 'b', '2', 'y2'], ['1/3/2014', 'c', '1', 'x3']]

我的問題是我怎麼把它與一些指數大熊貓數據幀?我不希望日期成爲指數。我需要一個通用的解決方案,我的數據集是1000行×50列。

回答

2

這裏是我會做什麼

import pandas as pd 
d=[['Date', 'letters', 'numbers', 'mixed'],\ 
    ['1/1/2014', 'a', '3', 'z1'],\ 
    ['1/2/2014', 'b', '2', 'y2'],\ 
    ['1/3/2014', 'c', '1', 'x3']] 
df = pd.DataFrame.from_records(d[1:],columns=d[0]) 
df.set_index('numbers') 

下面是結果

   Date letters mixed 
numbers 
3  1/1/2014  a z1 
2  1/2/2014  b y2 
1  1/3/2014  c x3 
0

對於任何人誰願意pandas dataframes與谷歌表,不要再連接! gspread-dataframe已在這裏。它提供了gspreadpandas之間的缺失鏈接。

pip install gspread-dataframe安裝。

0

另一種方式來谷歌電子表格傳輸到蟒熊貓和反之亦然。將通過使用df2gspread: http://df2gspread.readthedocs.io/en/latest/overview.html#usage1

它需要10分鐘來設置和只有3行代碼這樣的伎倆:

from df2gspread import gspread2df as g2d 
df = g2d.download(gfile="your_spreadsheet_ID", col_names=True, row_names=True) 

我只是設置這個,所以如果你有任何問題,隨時問。

相關問題