2010-01-20 217 views
2

您好我擁有Facebook頁面的URL列表Facebook頁面詳細信息和RESTful API?

eg... 
http://www.facebook.com/daftpunk 
http://www.facebook.com/DavidGuetta 
... 

什麼是最好的辦法:

  • 檢查如果這些網址實際上的Facebook網頁和檔案

  • 收藏牛逼細節從這些頁面

幫助,例如#的球迷將是非常讚賞。

回答

3

沒有刮任何內容(這是對服務的Facebook的條款反正):在 www.facebook.com/

  • 做一個後

    1. 提取URL 的用戶名部分即位形式的FQL查詢select fan_count from page where username='michaeljackson'
    2. 如果結果是返回,您知道這是一個 頁,而不是用戶的配置文件。

    查看Page FQL table瞭解可以在同一個調用中檢索到的其他數據。

  • +0

    這正是我所做的!謝謝,雖然,將有非常有用的昨天。upvoted – RadiantHex 2010-01-21 15:11:57

    2

    使用urllib2pyfacebook獲取內容

    使用BeautifulSouplxml解析它

    使用re模塊(正則表達式)提取內容的驗證和數據採集

    +0

    對不起,仍然不能幫助我** **粉絲** :( – RadiantHex 2010-01-20 22:01:47

    +0

    你必須自己提取,也許使用正則表達式。更新了答案。 – 2010-01-20 22:52:03

    +0

    好吧,我發現如何獲得#的粉絲,這些字段值在RESTful API中沒有引用,您可以在這裏查看http://wiki.developers.facebook.com/index.php/Pages.getInfo#Response fan_count在FQL查詢中可用。你建議颳去的網址,因此我的數據與BeautifulSoup或lxml? – RadiantHex 2010-01-20 23:03:50

    1

    的#的球迷是在一個類'FanManager'的標籤。你可以使用美麗的湯來獲取這個標籤的內容,並使用正則表達式從字符串(例如:1,000,000個粉絲)獲取數據作爲int或任何你想要的。

    要查看頁面是否存在,請檢查一些標籤以查看您是否在404頁面上。