我使用pytrends
自動從google趨勢下載csv
中的數據。我使用的代碼如下。在這種情況下,我正在下載每月谷歌趨勢數據從2008年到現在。Pytrends趨勢結果與手動下載數據不相似
from pytrends.request import TrendReq
from urllib.parse import unquote
from dateutil.relativedelta import relativedelta
import datetime
import pytrends
google_username = "[email protected]"
google_password = "xxxxx"
search_term = unquote('%2Fm%2F07gyp7')
google_trend = TrendReq(google_username, google_password, custom_useragent='Pytrends' )
google_trend_payload = {'gprop' : 'news' , 'q': search_term}
trendresult = TrendReq.trend(google_trend_payload, return_type = 'dataframe')
print(trendresult)
從谷歌網站前5個月,結果從pytrends結果相比:
Date Pytrends data Manual csv data
2008-01 21.0 28.0
2008-02 16.0 19.0
2008-03 16.0 21.0
2008-04 15.0 18.0
2008-05 22.0 31.0
任何人都知道的原因是什麼?謝謝。
我已經找到了使用Selenium測試框架完成此操作的最有效方法。我還沒有完成這項工作,但基本思想可以在這裏找到http://www.yseam.com/blog/TR.html。由於google改變了頁面上的規範,我們還需要更改鏈接中提供的一些代碼。 – DManh