2014-10-29 89 views
0

我是Python和BeautifulSoup的新手。實際上我從wunderground.com處理天氣數據,但是我也必須從freemeteo.com獲取一些數據。所以我有嚴重的問題。BeautifulSoup Table Scraping

創刊

因爲我在wunderground.com使用下面的代碼的歷史數據(注:wunderground.com有這種鏈接www.wunderground.com/history/airport/LTBA/2013/1/ 1)

for y in range(2009, 2014): 
    for m in range(1, 13): 
    for d in range(1,32): 
     if y%400 == 0: 
      leap = True 
     elif y%100 == 0: 
      leap = False 
     elif y%4 == 0: 
      leap = True 
     else: 
      leap = False 
     if (m == 2 and leap and d > 29): 
      continue 
     elif (m == 2 and d > 28): 
      continue 
     elif (m in [4, 6, 9, 10] and d > 30): 
      continue 

     url ="http://www.wunderground.com/history/airport/LTBJ/" + str(y) + "/" + str(m) + "/" + str(d) + "/DailyHistory.html" 

str()適用於wunderground.com鏈接,但freemeteo.com有以下類型的鏈接。

tr.freemeteo.com/havadurumu/antioch/history/daily-history/?gid=323779 &站= 8768 &日期= 2009-01-01 &語言=土耳其&國家=火雞

正如你可以看到,在日期文本前有1到10個數字「0」。這意味着我必須爲這些鏈接添加一些代碼。

第二個問題

freemeteo.com在頁面作爲linked pic表。

正如你可以在圖片中看到的,我只想從該表中獲取紅色框列數據並以下面的格式獲取.txt文件。我需要幫助。它將用在我的論文中。感謝您的關注。

20090101,00:00,1°C,-2°C,11 Km/h,75%,-3°C 
20090101,01:00,0°C,-3°C,7 Km/h,75%,-4°C 
20090101,02:00,-1°C,-4°C,7 Km/h,80%,-4°C, 
+0

有很多的服務,提供友好的API結果JSON,XML或者甚至是歷史預測數據CSV。 wunderground.com有很多的API,看看它的文檔 – 2014-10-29 22:39:05

+0

毛羅感謝您的反饋,但我現在沒有wunderground.com的問題。它與美麗的吻合很好。問題是freemeteo.com。我只是以wunderground.com爲例 – Syildiz 2014-10-30 06:23:39

回答