2011-10-15 75 views
0

我打算撰寫一篇關於使用情緒信息來增強某些貨幣金融交易模型的預測性的論文。關於使用twitter數據進行數據挖掘

該情緒數據應該是Twitter線程,包括一些關鍵字,如「EUR.USD」。我會過濾出一些情緒的話來確定情緒。簡單的想法。然後我們試着看看這種情緒程度與歐元兌美元匯率之間是否存在任何關係。

我最關心的是twitter數據。衆所周知,Twitter設置了查看歷史數據的限制。你只能瀏覽5天。自從我們基於日常情緒的策略以來,這是不夠的。

我注意到,谷歌有一個像對Twitter的更新時間表一些奇妙的事情:http://www.readwriteweb.com/archives/googles_twitter_timeline_lets_you_explore_the_past.php

但首先,我在瑞士,似乎我有我的谷歌沒有這樣的功能,這是太聰明,以確定我的位置並可能會阻止某些美國谷歌版本的功能。其次,即使我可以在我的Firefox上看到一些奇特的互動谷歌時間軸控制,我如何從我的查詢中挖掘數據並保存它們?谷歌是否提供這樣的API?

回答

2

您提到的Google服務最近已關閉,因此您將無法使用它。 (http://www.searchenginejournal.com/google-realtime-shuts-down-as-twitter-deal-expires/31007/

如果你需要數據的時間跨度較長,分析我看到下面的選項:

  • 工資歷史數據:)(https://dev.twitter.com/docs/twitter-data-providers
  • 如果你不想付出,您需要獲取包含EUR/USD的推文(無論您是否可以使用流媒體API)並以某種方式存儲它們。運行此服務一段時間(如果可能的話),您將擁有超過5天的數據。
+0

親愛的Norbip,非常感謝您對我的項目採取多種策略的回答。這真的很有幫助,雖然谷歌關閉服務令人傷心....你永遠不能依靠無邪大公司,對吧?:)我會盡力弄清楚自己,看看有什麼可能。我想第二種方法是最好的,我需要從今天開始收集數據:) –

+0

其實我錯了Streaming API。與搜索API相比,流式API返回結果的超集,並且採樣是可選的。根據這個我編輯了我的答案。我建議使用Streaming API。 ;) – norbip