2010-04-16 111 views
4

我正在建立一個數據庫+工具,搜索新聞提要的特定期限。例如「堅果食物中毒」。我想在這個術語中搜索社交媒體網站,新聞網站,主要新聞聚合商等。新聞提要API的一般新聞

  • 問題1:有一些消息 聚合器的API在那裏怎麼樣?
  • 問題2:你將如何去編碼和 只接收來自 API的最新消息?

編輯加原理: alt text http://koopics.com/news_parser.jpg

回答

4

你知道嗎Yahoo! Pipes?這是一個非常靈活的Feed聚合器,您可以使用YQL操作它,這是相當強大的有一個Python librabry,python-yql :)。 YQL對Twitter和其他服務和新聞來源也有特定的「表格」,因此,根據你的需要,你可能甚至不需要Pipes。

http://blog.ouseful.info/2009/04/27/using-yql-with-yahoo-pipes/上有一個Pipes + YQL用法的快速示例,但您可以在YQL Console上玩弄它們。

所以,這是你的「問題1」。但是,使用YQL,「問題2」(如果我理解正確的話)自然而然地出現,因爲您幾乎像常規SQL一樣使用它,施加限制,排序等。

+0

+1我一直在尋找這樣的事情:) 這裏有一個有趣[幻燈](http://www.slideshare.net/ConSanFrancisco123/yahoo-pipes-middleware-in-the-cloud) – CoderHawk 2010-07-20 10:05:43

+0

@桑迪:很好,很好的參考:) – rbp 2010-07-20 11:38:39

0

如果你有資金支持支持項目,路透社有新聞數據饋送,您可以每月訂閱。

1
+0

在網站上快速瀏覽一下,說他們自2007年以來一直沒有更新過 – dassouki 2010-04-17 19:41:45

+0

但是這並不符合你的要求? – 2010-04-18 04:12:34