我已經有了一個很好的Python腳本,它可以打印出來自給定用戶名的過去200條推文。Python:如何搜索推文並在數據庫中存儲?
但是,我想對其進行修改,以便它會收集過去200條包含特定哈希標籤(來自任何用戶名)的推文,然後我想將這些結果存儲在數據庫中。
任何人都可以提供關於如何修改下面的代碼的建議嗎?
import sys
import operator
import requests
import json
import twitter
twitter_consumer_key = 'XXXX'
twitter_consumer_secret = 'XXXX'
twitter_access_token = 'XXXX'
twitter_access_secret = 'XXXX'
twitter_api = twitter.Api(consumer_key=twitter_consumer_key, consumer_secret=twitter_consumer_secret, access_token_key=twitter_access_token, access_token_secret=twitter_access_secret)
statuses = twitter_api.GetUserTimeline(screen_name=handle, count=200, include_rts=False)
for status in statuses:
if (status.lang == 'en'):
print status
的可能的複製[Twitter的API - ?具有一定的主題標籤顯示所有微博](http://stackoverflow.com/questions/2714471/twitter-api-display-all- tweet with-a-certain-hashtag) –
[它似乎不可能](https://twittercommunity.com/t/get-user-timeline-tag-filtering/17508)通過hashtag與[ GetUserTimeline](https://dev.twitter.com/rest/reference/get/statuses/user_timeline)函數。根據Xander的建議,[GetSearch](https://pythonism.wordpress.com/2013/10/12/using-the-twitter-api-with-python-twitter/)方法可能會有所幫助。否則,您可以一次下載200批次的推文,並自行過濾(我認爲Twitter限制您下載用戶的最後3200條推文)。 – Boa
至於存儲在數據庫中,除非您在提供數據庫抽象層(即Django,web2py等)的某個框架內工作,請查閱http://www.sqlalchemy.org/。 – Boa