2016-11-09 64 views
0

我嘗試從GooglePlay中的搜索中過濾軟件包名稱。所以用戶輸入「Facebook」,我的腳本識別包名。 我試着用BeautifulSoup4做到這一點。我認爲這是最好的解決方案。來自GooglePlay輸出的Python篩選器軟件包名稱

所以.. 這裏是我的代碼,我試圖

br = mechanize.Browser() 
br.set_handle_robots(False) 
br.addheaders = [('User-agent', 'chrome')] 

term = "faceboook" 
query = "http://play.google.com/store/search?q="+term 

htmltext = br.open(query).read() 

soup = BeautifulSoup(htmltext) 

search = soup.findAll("div", class_="card-content id-track-click id-track-impression") 

print search 

輸出:

[<div class="card-content id-track-click id-track-impression" data-docid="com.facebook.katana" (and so on) 

如何獲得這隻包的名字嗎?我真的不知道如何。我已經閱讀了關於BeautifulSoup的一些文檔,但我很不理解我如何使用這個擴展。

非常感謝您的幫忙!

回答

1

據我瞭解,你可以/應該得到data-docid屬性的值:

[item.get("data-docid", "n/a") for item in search] 
+0

謝謝你,但現在我得到「[‘com.facebook.katana’,「com.facebook.orca ','com.facebook.Mentions','com.htc.sense.socialnetwork.facebook','com.twitter.android','com.instagram.android'「 – Lucas

+0

現在如何過濾?我不能在那裏使用分割 – Lucas

相關問題