任何人都可以幫助我從網站上使用Python「提取」東西嗎?這裏是信息: 我有文件夾名稱與一組數字(他們是項目的ID),我必須使用該ID進入頁面,然後從頁面「廢」信息到我的記事本...這就像這樣:http ://www.somesite.com/pic.mhtml?id = [ID] ...我需要從圖片鏈接中提取圖片鏈接(圖片鏈接總是在文件末尾有ID.jpg)並將其寫入記事本中然後用該圖片的名稱替換該txt名稱...圖片始終在標題標籤...在此先感謝...如何使用Python將網頁元素解析爲記事本?
-1
A
回答
0
您需要的是一個數據刮板 - http://www.crummy.com/software/BeautifulSoup/將幫助您將數據從網站拉出。然後,您可以將該數據加載到變量中,將其寫入文件,或者執行通常對數據執行的任何操作。
0
你可以嘗試解析圖像的html源代碼。 嘗試類似的東西:
class Parser(object):
__rx = r'(url|src)="(http://www\.page\.com/path/?ID=\d*\.(jpeg|jpg|gif|png)'
def __crawl(self, url):
images = []
code = urllib.urlopen(url).read()
for line in code.split('\n'):
imagesearch = re.search(self.__rx, line)
if imagesearch:
image = '%s.%s' % (imagesearch.group(2), imagesearch.group(4))
images.append(image)
return images
它untestet,你可能要檢查的正則表達式
相關問題
- 1. 如何使用python解析json元素?
- 2. 將標記解析爲元素樹
- 3. 使用Python解析多個網頁
- 4. 如何使用C#將網頁保存爲文本文件供以後解析
- 5. 如何使用PHP解析網頁?
- 6. 使用Python解析wikitext中的元素和子元素3
- 7. 如何使用Python訪問網頁中的任何元素?
- 8. 如何使用python解析包含CSS和HTML的網頁
- 9. 如何使用線程解析Python中的多個網頁?
- 10. 使用python解析網頁上的HTML和腳本?
- 11. 使用BeautifulSoup4解析網頁
- 12. 使用php解析網頁
- 13. 解析網頁使用PowerShell
- 14. 如何解析XML元素?
- 15. 如何解析HTML元素?
- 16. jQuery:將JSON解析爲元素數組
- 17. JAXB - 將元素解析爲字符串
- 18. 如何使用二進制元素將數據解析到Python列表中?
- 19. 如何使用Selenium-Python突出顯示網頁上的元素?
- 20. Google如何解析網頁?
- 21. 如何解析網頁
- 22. 網頁創建記事本++
- 23. XSLT - 如何使用遞歸元素將xml解析到Eclipse toc.xml?
- 24. 爲什麼要使用Schema.org微數據標記網頁元素?
- 25. 如何使用JAXB將空標記解析爲標記元素的名稱而不是空字符串的值?
- 26. 如何在Python中解析此網頁(並轉換爲字典)
- 27. 如何將PHP/Python解釋器集成到記事本++
- 28. 如何使用html元素清除網頁中的文本框
- 29. 解析XML元素使用解組
- 30. 使用VB.NET將XML元素解析爲列表(字符串)