2013-04-18 73 views
0

我有一個使用cgi腳本打印出csv數據的網頁。我想用Python解析數據。到目前爲止,我知道我可以使用urllib來請求url並將html獲取到一個巨大的字節字符串中。但是,它包含的內容遠遠多於我需要的csv數據,包括html標籤,換行符等等。我想對這些數據做的事情是能夠過濾行和列。這些數據最終會進入另一個csv文件,我可以使用它作爲數據在圖表中顯示(高圖)。Python:我如何從網頁收集和解析csv數據?

我該如何解析只有csv的html?有沒有一個庫可以將csv收集到字典中,甚至更好,一個csv文件?

感謝

+1

Scrapy也許http://scrapy.org/ –

+0

感謝您的建議。看起來Scrapy肯定可以工作。不幸的是,這將比我想象的更簡單地過濾網頁中的行和列:( – imagineerThat

+1

是的,直接訪問數據庫會讓事情變得更容易 – MattDMo

回答

1

嘗試

1)使用urlib你所提及般

2)使用Beautiful soup爲歌廳的文檔的一部分,你需要

3)使用標準csv parserpandas解析您在上一步驟收到的數據