2017-04-11 104 views

回答

2

您可以使用read_csv與參數skiprowsnames新列名:

url = 'https://www.google.com/finance/getprices?q=HINDALCO&i=60&p=15d&f=d,o,h,l,c,v' 
df = pd.read_csv(url, skiprows=[0,1,2,3,5,6]).rename(columns={'COLUMNS=DATE':'DATE'}) 

print (df.head()) 
      DATE CLOSE HIGH  LOW OPEN VOLUME 
0 a1490154300 194.80 194.80 194.80 194.80 2600 
1   1 193.55 194.70 193.00 194.15 339142 
2   2 193.80 193.95 193.55 193.60 242687 
3   3 194.20 194.40 193.80 193.90 119874 
4   4 193.80 194.20 193.80 194.20 121355 
+0

感謝親愛的很多 –

+0

你對日期時間有什麼想法我怎麼能轉換日期[1]意味着1分鐘日期2意味着2分鐘等等 –

+0

好吧,但'a1490154300'意味着什麼?這是日期還是時間? – jezrael

0

如果你不講究讓您的只有谷歌的數據,這將工作無線th Yahoo:

import pandas as pd 
import pandas_datareader.data as web 
from datetime import datetime 

start = datetime(2014, 6, 2) 
end = datetime(2014, 9, 5) 

hindalco = web.DataReader('HINDALCO.NS', 'yahoo', start, end) 

In [15]: hindalco.head(5) 
Out[15]: 
      Open High  Low Close Volume Adj Close 
Date               
2014-06-02 147.3 151.15 146.35 150.05 13844600 146.2012 
2014-06-03 150.7 155.70 149.35 155.20 23276100 151.2191 
2014-06-04 156.0 161.75 155.20 160.70 15948200 156.5780 
2014-06-05 160.6 171.00 159.95 169.85 20296900 165.4934 
2014-06-06 172.0 172.10 165.30 169.25 13769100 164.9087 

您需要安裝pandas-datareader。

sudo -H pip install pandas-datareader (ubuntu) 
pip install pandas-datareader (windows) 
+0

我曾嘗試使用'HINDALCO'作爲公司代碼和谷歌而不是雅虎,但這並沒有奏效。然而,美國股市像蘋果與谷歌合作: 蘋果= web.DataReader(「AAPL」,「谷歌」,開始,結束) – dmdip

+0

我想1mins數據不是每天 –

0

@jezrael]已回答您對Hindalco一分鐘數據的問題。這裏的或多或少相同的答案,調整了一下:

import pandas as pd 
period = 60 #one minute 
days = 2 # 2 days of data 
ticker = 'HINDALCO' 
url = 'http://www.google.com/finance/getprices?i={}&p={}d&f=d,o,h,l,c,v&df=cpct&q={}'.format(period, days, ticker) 
cols = ['minute', 'open', 'high', 'low', 'close', 'volume'] 
df = pd.read_csv(url, skiprows=8, header=None, names=cols) 
df.head() 

輸出:

minute open high  low close volume 
0  1 194.35 194.35 193.80 193.85 25785 
1  2 194.15 194.40 194.00 194.35 64580 
2  3 193.95 194.25 193.85 194.15 42980 
3  4 193.80 193.95 193.75 193.90 33936 
4  5 193.90 193.90 193.60 193.80 57088 
+0

我可以更改分鐘1格式上午9:15如此在 –

+0

是的,你可以。您必須使用顯示爲** a1490154300 **的字段值。基本上1490154300是數據的起始時間,以1970年1月1日5.30 AM IST的秒數來衡量。 (實際上是0000 UTC)。 要在該字段值中添加顯示在該列中的分鐘數。 – dmdip

+0

更正前面給出的代碼。 df = pd.read_csv(url,skiprows = 7,header = None,names = cols) – dmdip