2017-10-09 45 views
-2

我想在Instagram中提取隨機網頁的追隨者。我試圖將python與Beautiful Soup結合使用。Instagram Web抓取追隨者

不過我還沒有收到在網頁的任何信息,在那裏我可以訪問

def get_user_info(user_name): 
    url = "https://www.instagram.com/" + user_name + "/?__a=1" 
    try: 
     r = requests.get(url) 
    except requests.exceptions.ConnectionError: 
     print ('Seems like dns lookup failed..') 
     time.sleep(60) 
     return None 
    if r.status_code != 200: 
     print ('User: ' + user_name + ' status code: ' + str(r.status_code)) 
     print (r) 
     return None 
    info = json.loads(r.text) 
    return info['user'] 

get_user_info("wernergruener")  

如前所述我不明白的頁面的追隨者。我怎麼能這樣做?

乾杯, 安迪

+0

我試過在'wernergruener'中搜索instagram,然後空着。那是確切的名字嗎? –

回答

0

隨着API/JSON:

我不熟悉Instagram的API,但它並不像它返回一個人的追隨者的詳細信息,只追隨者的數量。

您應該能夠使用info["user"]["followed_by"]["count"]獲取該信息。

隨着原材料頁/美麗的湯:

假設非API頁面顯示你想了解一個人的追隨者的信息,你要下載的原始的HTML(而不是JSON),並對其進行解析使用美麗的湯。

def get_user_info(user_name): 
    url = "https://www.instagram.com/" + user_name 
    try: 
     r = requests.get(url) 
    except requests.exceptions.ConnectionError: 
     print ('Seems like dns lookup failed..') 
     time.sleep(60) 
     return None 
    if r.status_code != 200: 
     print ('User: ' + user_name + ' status code: ' + str(r.status_code)) 
     print (r) 
     return None 
    soup = BeautifulSoup(r.text, 'html.parser') 
    # find things using Beautiful Soup 

get_user_info("wernergruener")  

美麗的湯有一些我讀過的最直觀的文檔。我想從那裏開始: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

隨着API /蟒蛇,Instagram的:

其他人已經做了很多繁重的你的。我認爲python-instagram應該爲您提供更容易訪問您想要的信息。