Facebook通過他們的廣告平臺提供有關人口統計的數據。如何刮(使用Python)?如何刮臉Facebook的廣告數據?
1)去http://www.facebook.com/ads/create/
2.)填寫表格
3.)現在,存在數據
見樣本圖像:HTTP:// www.webdistortion.com /wp-content/uploads/2010/10/fb4.jpg (我是新用戶,所以我不能發佈圖片)
問題:如何刮呢?
我的想法:
1)使用機械化 - 也許它可以填寫表格,但估計人數(112960中的例子)是不是在源代碼中可見的,因此,你不能分析它=>我們應該做一些其他的技巧,但是什麼?
2)使用硒(或風車) - 我的記錄是:打開facebook.com - >點擊廣告 - >點擊製作廣告 - > ...
不幸的是,這已經失敗了。登錄:
[info] Executing: |open |/| |
[info] Executing: |clickAndWait | link=Advertising | | [error] isNewPageLoaded found an old pageLoadError: Error: Permission denied for >> to get property Location.href [error] Permission denied for to get property Location.href [info] Executing: |clickAndWait | css=span.uiButtonText | | [error] Unexpected Exception: fileName -> chrome://selenium-ide/content/selenium-core/scripts/selenium-browserbot.js, lineNumber -> 840
有證據表明,有可能刮這樣的數據:http://www.checkfacebook.com/
解決這個問題是不是數據本身(OFC,這個數據肯定是有趣的)更有趣。我知道有解決方案,但我不能拿出任何解決方案。這是殺了我,請幫助。
只是一個簡短的評論。當你說「在源代碼中不可見」時,你的意思是在原始源代碼中不可見。如果它顯示在屏幕上,那麼它就是HTML,因此會出現在文檔中。 – 2012-01-05 23:46:54