使用我的功能,我可以從Twitter xml搜索頁面中提取用戶名,作爲我正在構建爲項目的朋友查找器應用程序。但問題是,當我抓住用戶名並將它們輸入到列表中時,發生了一些奇怪的事情。而不是每個用戶名作爲列表中的一個單獨的元素,我有每個用戶名是它自己的列表。從Twitter的XML頁面提取數據的列表問題
所以我得到20左右的名單。這裏是我的代碼產生的一個例子 list = [「twitter.com/username」],[「twitter.com/username1"],["twitter.com/username2」]
所以你看到每一個用戶名是它自己的列表。我有三個列表,每列有一個值,而不是有三個值的列表。這是一個絕對的噩夢迭代。我怎樣才能做到這一點,所以我有三個元素的列表?
代碼是在這裏:
def get_names(search_term = raw_input("What term do you want to search for?")):
search_page = "http://search.twitter.com/search.atom?q="
search_page += search_term
data = []
doc = urllib.urlopen(search_page).read()
soup = BeautifulStoneSoup(''.join(doc))
data = soup.findAll("uri")
for uri in soup.findAll('uri'):
data = []
uri = str(uri.extract())
data.append(uri[5:-6]
print data
你應該嘗試使用LXML作爲它比BeautifulSoup快得多。 – cerberos