某些網頁擁有他們的網址,其中包含超鏈接的「下載」文本。如何從網頁下載文件?
如何通過python或ironpython獲取超鏈接形式的URL /頁面。
我可以用python或ironpython下載帶有這些超鏈接的文件嗎? 我該怎麼做?
是否有任何C#工具?
我不是英語母語的人,所以很抱歉我的英語。
某些網頁擁有他們的網址,其中包含超鏈接的「下載」文本。如何從網頁下載文件?
如何通過python或ironpython獲取超鏈接形式的URL /頁面。
我可以用python或ironpython下載帶有這些超鏈接的文件嗎? 我該怎麼做?
是否有任何C#工具?
我不是英語母語的人,所以很抱歉我的英語。
您應該可以使用CPython(普通Python)和IronPython的BeautifulSoup library。檢查出findAll()方法。這應該列出所有鏈接的列表。
soup.findAll('a')
美麗的湯中文文檔http:// www.crummy.com/software/BeautifulSoup/documentation.zh.html – jcao219 2010-07-16 01:06:13
最簡單的方法是將HTML頁面傳遞到XML/HTML解析器,然後在根節點上調用getElementsByTagName("A")
。一旦你明白了,遍歷整個列表並取出href
參數。
我想你是指超鏈接。 – jcao219 2010-07-16 00:59:16
@ jcao219:對不起,^ _ ^。 – Begtostudy 2010-07-16 01:03:40
對於你的問題的第二部分: http://stackoverflow.com/questions/257409/download-image-file-from-the-html-page-source-using-python – Cambium 2010-07-16 01:12:40