您好我擁有Facebook頁面的URL列表Facebook頁面詳細信息和RESTful API?
eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...
什麼是最好的辦法:
檢查如果這些網址實際上的Facebook網頁和不檔案
收藏牛逼細節從這些頁面
幫助,例如#的球迷將是非常讚賞。
您好我擁有Facebook頁面的URL列表Facebook頁面詳細信息和RESTful API?
eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...
什麼是最好的辦法:
檢查如果這些網址實際上的Facebook網頁和不檔案
收藏牛逼細節從這些頁面
幫助,例如#的球迷將是非常讚賞。
沒有刮任何內容(這是對服務的Facebook的條款反正):在 www.facebook.com/
select fan_count from page where username='michaeljackson'
查看Page FQL table瞭解可以在同一個調用中檢索到的其他數據。
您可以使用scrapy或BeautifulSoup來刮取內容。
對不起,仍然不能幫助我** **粉絲** :( – RadiantHex 2010-01-20 22:01:47
你必須自己提取,也許使用正則表達式。更新了答案。 – 2010-01-20 22:52:03
好吧,我發現如何獲得#的粉絲,這些字段值在RESTful API中沒有引用,您可以在這裏查看http://wiki.developers.facebook.com/index.php/Pages.getInfo#Response fan_count在FQL查詢中可用。你建議颳去的網址,因此我的數據與BeautifulSoup或lxml? – RadiantHex 2010-01-20 23:03:50
的#的球迷是在一個類'FanManager'的標籤。你可以使用美麗的湯來獲取這個標籤的內容,並使用正則表達式從字符串(例如:1,000,000個粉絲)獲取數據作爲int或任何你想要的。
要查看頁面是否存在,請檢查一些標籤以查看您是否在404頁面上。
這正是我所做的!謝謝,雖然,將有非常有用的昨天。upvoted – RadiantHex 2010-01-21 15:11:57