我正嘗試使用urllib2在以下URL中讀取:http://frcwest.com/然後搜索數據以找到元重定向。Beautifulsoup功能在特定的senario中無法正常工作
它讀取以下數據:
<!--?xml version="1.0" encoding="UTF-8"?--><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"><head><title></title><meta content="0;url= Home.html" http-equiv="refresh"/></head><body></body></html>
讀入Beautifulsoup工作正常。然而由於某些原因,沒有任何功能適用於這種特定的危險,我不明白爲什麼。 Beautifulsoup在所有其他情況下都非常適合我。但是,在簡單嘗試時:
soup.findAll('meta')
不產生任何結果。
我的最終目標是運行:
soup.find("meta",attrs={"http-equiv":"refresh"})
但如果:
soup.findAll('meta')
甚至沒有工作,然後我卡。任何煽動這個謎,將不勝感激,謝謝!
什麼版本Beautifulsoup您使用的是?使用'導入請求;從bs4導入BeautifulSoup; BeautifulSoup(requests.get(your_url))。find_all('meta')'對我來說工作正常.. – 2013-04-21 18:23:52
嘿喬恩,感謝您的快速回復。我正在使用bs4。但是要導入,解析我使用httplib2和html5lib的數據。根據你的迴應和Martijn的迴應,看起來這是錯誤的根源。看來你正在使用請求庫(來自python-requests.org)來使它工作。我不知道這些資源,我會繼續玩下去,謝謝! – bmiskie 2013-04-21 18:40:41