2012-02-04 55 views
3

我想從Python訪問Facebook:D從Python訪問Facebook

我想獲取一些需要我登錄才能查看的數據。我知道我需要cookie等來查看Python中的數據,但對於cookie我完全無能爲力。

如何使用Python登錄到Facebook,導航到多個頁面並檢索一些數據?

+0

使用facebook api從facebook獲取數據。 – Vilva 2012-02-04 05:46:15

回答

1

好的。這可能是一個非常大的問題。而不是使用標準API來檢索信息,您希望篩選廢品?

這是可能的 - 雖然不推薦屏幕抓取取決於HTML格式不變。然而,這不是一個不可能的任務。

要開始,你想看看打開網址:

http://docs.python.org/library/urllib2.html

這是超級容易 - 在頁面上的例子會告訴你是這樣的:

>>> import urllib2 
>>> f = urllib2.urlopen('http://facebook.com/') 
>>> print f.read() 

而且你看到你有HTML。

現在Facebook將是比一般的網站更聰明規避這種類型的登錄版的:我希望

所以,你可能婉看手工處理的會話:

import urllib2 
req = urllib2.Request('http://www.facebook.com/') 
req.add_header('Referer', 'http://www.lastpage.com/') 
r = urllib2.urlopen(req) 

全部剪斷來自python文檔。

+0

:D謝謝:D:D – Matthew 2012-02-09 10:28:18

+0

HA。沒問題。我有部分屏幕抓取代碼,如果你想要它 - 它是爲另一個網站設計的,但我想你可以改裝它。 – Glycerine 2012-02-09 12:00:32