我是Python和BeautifulSoup的新手。實際上我從wunderground.com處理天氣數據,但是我也必須從freemeteo.com獲取一些數據。所以我有嚴重的問題。BeautifulSoup Table Scraping
創刊
因爲我在wunderground.com使用下面的代碼的歷史數據(注:wunderground.com有這種鏈接www.wunderground.com/history/airport/LTBA/2013/1/ 1)
for y in range(2009, 2014):
for m in range(1, 13):
for d in range(1,32):
if y%400 == 0:
leap = True
elif y%100 == 0:
leap = False
elif y%4 == 0:
leap = True
else:
leap = False
if (m == 2 and leap and d > 29):
continue
elif (m == 2 and d > 28):
continue
elif (m in [4, 6, 9, 10] and d > 30):
continue
url ="http://www.wunderground.com/history/airport/LTBJ/" + str(y) + "/" + str(m) + "/" + str(d) + "/DailyHistory.html"
str()適用於wunderground.com鏈接,但freemeteo.com有以下類型的鏈接。
tr.freemeteo.com/havadurumu/antioch/history/daily-history/?gid=323779 &站= 8768 &日期= 2009-01-01 &語言=土耳其&國家=火雞
正如你可以看到,在日期文本前有1到10個數字「0」。這意味着我必須爲這些鏈接添加一些代碼。
第二個問題
freemeteo.com在頁面作爲linked pic表。
正如你可以在圖片中看到的,我只想從該表中獲取紅色框列數據並以下面的格式獲取.txt文件。我需要幫助。它將用在我的論文中。感謝您的關注。
20090101,00:00,1°C,-2°C,11 Km/h,75%,-3°C
20090101,01:00,0°C,-3°C,7 Km/h,75%,-4°C
20090101,02:00,-1°C,-4°C,7 Km/h,80%,-4°C,
有很多的服務,提供友好的API結果JSON,XML或者甚至是歷史預測數據CSV。 wunderground.com有很多的API,看看它的文檔 – 2014-10-29 22:39:05
毛羅感謝您的反饋,但我現在沒有wunderground.com的問題。它與美麗的吻合很好。問題是freemeteo.com。我只是以wunderground.com爲例 – Syildiz 2014-10-30 06:23:39