2012-12-11 33 views
0

我試圖從網站讀取數據並將該數據存儲到變量中。 例子:讀取標籤值並存儲到變量中

http://www.example.com/example-info.php - >

名稱:鮑勃

地址:1234街

電話:000-000-0000

電子郵件:[email protected]

我想要做的是從標籤「名稱」這是鮑勃的價值,並將其存儲到一個變量,如一個s「用戶名」。或「電話」並將該值存儲到名爲「電話」的變量中。有人能指引我走向正確的方向嗎?也許我需要使用機械化?

回答

0

您是否想要screen scrape的網站?如果是這樣,使用requestsBeautifulSoup是很好的事情來看看。

import requests 
x = requests.get('http://www.google.com') 
if x.status_code == 200: 
    print x.content 

在上述情況下x.content將從您發送請求到頁面保存數據/ HTML。然後,你可以使用BeautifulSoup或正則表達式來提取出你需要的特定信息。

0

你可以有一個dict來存儲您的鍵和值,和翻譯

mapping = {"Telephone": "Phone", "Name": "Username"} 
details = {} 

details[mapping.get(web_key, web_key)] = web_value 

因此例如映射字典

>>> web_dict = {"Name": "Bob", "Address": "1234 Street", "Telephone": "000-000-0000", "Email": "[email protected]"} 
>>>  
>>> for web_key, web_value in web_dict.iteritems(): 
...  details[mapping.get(web_key, web_key)] = web_value 
... 
>>> print details 
{'Username': 'Bob', 'Phone': '000-000-0000', 'Email': '[email protected]', 'Address': '1234 Street'} 

當然,這是隻有一半的答案,你將需要一些東西來解析HTML到字典開始。

相關問題