2011-07-28 45 views
1

我在Python新手,從我的老闆給一個任務來完成:從Twitter的JSON如何從Twitter使用NLTK搶流數據 - 正則表達式

  1. 抓取數據流
  2. 解析使用NLTK和正則表達式
  3. 保存到文件底部或數據庫文件,確定

是否有任何人知道如何抓住從Twitter使用上述步驟中的數據流?

你的幫助將是非常感激:)

+0

如果你得到它的JSON,爲什麼你會需要正則表達式? –

+0

這不是一個是或否的問題... –

+0

不,那不是這個網站是如何工作的。用新信息編輯您的問題。 –

回答

2

一個快速谷歌搜索產量Tweepy,這是一個用於訪問Twitter的API一個Python庫。這應該讓你開始。在解析數據方面,您需要更具體一些,以瞭解您想要解析的內容。

+0

+1沒有重點發明車輪。 –

1

這應該指向你在正確的方向

import urllib2, simplejson 

json = urllib2.urlopen('http://search.twitter.com/search.json?q=from%3Aalexiskold').read() 
tweets = simplejson.loads(json)["results"] 
for tweet in tweets: print tweet["text"] 

不會eval所以我用simplejsonhttp://simplejson.github.com/simplejson/