2017-08-28 110 views
0

我想開一個網站,以從中下載簡歷,但下面的代碼試圖獲得絕對路徑,而不是隻是URL:web瀏覽器模塊搜索URL以絕對路徑

import webbrowser 
soup = BeautifulSoup(webbrowser.open('www.indeed.com/r/Prabhanshu-Pandit/dee64d1418e20069?sp=0'),"lxml") 

生成以下錯誤:

gvfs-open: /home/utkarsh/Documents/Extract_Resume/www.indeed.com/r/Prabhanshu- 
Pandit/dee64d1418e20069?sp=0: 
error opening location: Error when getting information for file 
'/home/utkarsh/Documents/Extract_Resume/www.indeed.com/r/Prabhanshu- 
Pandit/dee64d1418e20069?sp=0': No such file or directory 

很明顯,它採取的家庭住址,並試圖在網上搜索不會出現。我在這裏做錯了什麼?在此先感謝

回答

0

我想你混淆了美麗的湯和網頁瀏覽器的使用在一起。瀏覽器不需要訪問該頁面。

Documentation

適應的tutorial example給你的任務,打印簡歷輸出

from bs4 import BeautifulSoup 
import requests 
url = "www.indeed.com/r/Prabhanshu-Pandit/dee64d1418e20069?sp=0" 
r = requests.get("http://" +url) 
data = r.text 
soup = BeautifulSoup(data, "html.parser") 
print soup.find("div", {"id": "resume"}) 
+0

首先感謝您對本。其實我必須做到多個簡歷,我想寫一個txt文件的響應......你可以提出任何方式,以及...在此先感謝 – utkarsh

+0

我的建議是寫下一個函數獲得在輸入一個網址並將該簡歷打印在一個文件中,該文件以從課程中提取的人員的姓名命名。之後,如果你已經知道你必須處理的url,將它們存儲在一個列表中,然後創建一個循環,逐個提取url並調用該函數。 – aberna

+0

但網址沒有任何模式,我的意思是它的名稱跟隨着一些ID,所以如何預測下一個URL – utkarsh