0
我有一個使用cgi腳本打印出csv數據的網頁。我想用Python解析數據。到目前爲止,我知道我可以使用urllib來請求url並將html獲取到一個巨大的字節字符串中。但是,它包含的內容遠遠多於我需要的csv數據,包括html標籤,換行符等等。我想對這些數據做的事情是能夠過濾行和列。這些數據最終會進入另一個csv文件,我可以使用它作爲數據在圖表中顯示(高圖)。Python:我如何從網頁收集和解析csv數據?
我該如何解析只有csv的html?有沒有一個庫可以將csv收集到字典中,甚至更好,一個csv文件?
感謝
Scrapy也許http://scrapy.org/ –
感謝您的建議。看起來Scrapy肯定可以工作。不幸的是,這將比我想象的更簡單地過濾網頁中的行和列:( – imagineerThat
是的,直接訪問數據庫會讓事情變得更容易 – MattDMo