2016-07-07 61 views
0

我對Python很新穎,...呃...讓我們說,在編碼方面不是真正的專家。因此,提前非常缺乏業餘愛好的問題。我正在嘗試合併幾個googletrends report.csv文件以用於我的研究。在Python中合併GoogleTrends數據報告

兩個問題我遇到:

  1. 報告文件不只是一個電子表格,但含有大量的是不相關的其他信息。即我只想要合併每個文件的某個數組(真的只是想要每天的數據包含日期和每個月的相應SVI)說:列6到30)

  2. 由於(日常)數據將從月度報告文件中提取,月份沒有固定的天數,我不能只使用固定列數來讀取,但需要根據特定月份的天數來確定。

非常感謝您的幫助!

編輯:

我使用的代碼:

import pandas as pd 
report = pd.read_csv('C:/Users/paul/Downloads/report.csv', skiprows=4, skipfooter=17) 
print(report) 

The output it produces

我設法削減前幾行過,但我不知道如何從切斷底位從第31行開始。所以skipfooter似乎沒有工作。但是由於月份沒有相同的天數,所以我不能使用nrows,所以我不會提前知道行數。

+0

需要你有什麼樣的東西和你想要的東西 –

+0

一個友好的指針 - 雖然這裏的人肯定樂意提供幫助,但這不是一個'爲我代碼'服務。他們喜歡看到你先走了。 – dodell

+0

對不起,我承認,這是一個相當混亂的問題。查看上面的代碼和輸出。 – PaulWohlfarth

回答

0

事實證明,它確實有助於偶爾讀取python給出的警告。

ParserWarning:由於'c'引擎不支持skip_footer;因此回落到'python'引擎。你可以通過指定engine ='python'來避免這個警告。

我有這個問題,skip_footer選項不起作用,顯然與使用的c引擎有關。

對於運行到同一問題的人,這裏是我解決了它的代碼:

import pandas as pd 
report = pd.read_csv('C:/Users/paul/Downloads/report.csv', skiprows=4, skip_footer=27, engine='python') 

print(report) 

只需添加引擎=「蟒蛇」擺脫的C發動機的問題。不要問我爲什麼最終跳過了27行(我確信我計數爲17),但是有一些試驗和錯誤,這只是工作。