我試圖從網站讀取數據並將該數據存儲到變量中。 例子:讀取標籤值並存儲到變量中
http://www.example.com/example-info.php - >
名稱:鮑勃
地址:1234街
電話:000-000-0000
電子郵件:[email protected]
我想要做的是從標籤「名稱」這是鮑勃的價值,並將其存儲到一個變量,如一個s「用戶名」。或「電話」並將該值存儲到名爲「電話」的變量中。有人能指引我走向正確的方向嗎?也許我需要使用機械化?
我試圖從網站讀取數據並將該數據存儲到變量中。 例子:讀取標籤值並存儲到變量中
http://www.example.com/example-info.php - >
名稱:鮑勃
地址:1234街
電話:000-000-0000
電子郵件:[email protected]
我想要做的是從標籤「名稱」這是鮑勃的價值,並將其存儲到一個變量,如一個s「用戶名」。或「電話」並將該值存儲到名爲「電話」的變量中。有人能指引我走向正確的方向嗎?也許我需要使用機械化?
您是否想要screen scrape的網站?如果是這樣,使用requests或BeautifulSoup是很好的事情來看看。
import requests
x = requests.get('http://www.google.com')
if x.status_code == 200:
print x.content
在上述情況下x.content
將從您發送請求到頁面保存數據/ HTML。然後,你可以使用BeautifulSoup或正則表達式來提取出你需要的特定信息。
你可以有一個dict
來存儲您的鍵和值,和翻譯
mapping = {"Telephone": "Phone", "Name": "Username"}
details = {}
details[mapping.get(web_key, web_key)] = web_value
因此例如映射字典
>>> web_dict = {"Name": "Bob", "Address": "1234 Street", "Telephone": "000-000-0000", "Email": "[email protected]"}
>>>
>>> for web_key, web_value in web_dict.iteritems():
... details[mapping.get(web_key, web_key)] = web_value
...
>>> print details
{'Username': 'Bob', 'Phone': '000-000-0000', 'Email': '[email protected]', 'Address': '1234 Street'}
當然,這是隻有一半的答案,你將需要一些東西來解析HTML到字典開始。