我想在本網站獲得公司名稱https://siftery.com/microsoft-outlook 基本上它列出了一些使用Microsoft Outlook的公司。 我使用了BeautifulSoup,請求,urllib和urllib2,但我仍然沒有得到使用Microsoft Outlook的公司的名稱,甚至沒有在網站的第一頁。試圖使用python刮這個網站,但無法獲得所需的數據
我寫的代碼如下 -
r = requests.get('http://siftery.com/microsoft-outlook')
print(str(r.content))
f=open('abc.txt','w')
f.write(r.content)
f.close()
和自己感興趣的部分輸出是這樣的 -
({ 「名」: 「市場營銷」, 「處理」: 「市場營銷」 ,「categories」:[{「name」:「Marketing Automation」,「handle」:「marketing-automation」,「external_id」:「tgJ_49k7v4J-wV」,「parent_handle」:null,「categories」:[{「name 「:」Marketing Automation Platforms「,」handle「:」marketing-automation-platforms「,」external_id「:」tgJLE9aHoLdneT「,」parent_handle「:」marketing-automation「},
BeautifulSoup也給了我相同的輸出,所以其他庫。 看起來像「external_id」是公司名稱的地方?我不確定。我還嘗試使用gedit手動查找公司的名稱,例如Acxiom,但找不到任何事件。
你的內容尋找是在頁面使用javascript加載後生成的。我使用[Selenium](http://www.seleniumhq.org/)來解決類似的問題。 – SuperShoot