2014-03-03 102 views
0

我正在尋找一個應用程序,它可以跟蹤Twitter中的hashtag,獲取id和文本,並將其存儲在MySQL數據庫中。因此,應用程序應該能夠 -在twitter上跟蹤標籤

  1. 繼續檢查以查看是否有人在特定哈希標籤上發送了推文(例如 - #example)。
  2. 存儲推文的詳細信息。

我的代碼可以請求twitter搜索哈希標籤,並返回包含給定哈希標籤的20條推文列表。

所以現在我的問題是:

  1. 如何確保同樣的鳴叫不會被再次拉昇? (我可以隨時存儲推特ID,並檢查添加新推文時是否已存在,但不知道這是否是正確的方法)
  2. 我想在幾個小時內完成此操作,所以我是否需要包含任何類型的刷新代碼或可以不斷運行搜索的內容? (具體而言,我想搜索並且加上新的鳴叫,不存在的。因此,任何人誰鳴叫後,我開始跟蹤主題標籤,我想那些鳴叫得到保存)

更多信息/代碼,需要,請問,我可以在這裏發佈!忍受着我,我是這個初學者。

+0

使用Twitter API。 – poke

回答

-1

所以,我認爲你應該使用正則表達式 - >Here

Twitter的鳴叫的結構如下:

`<div class="tweet original-tweet js-stream-tweet js-actionable-tweet js-profile-popup-actionable js-original-tweet" data-you-block="false" data-you-follow="false" data-expanded-footer="<div class="js-tweet-details-fixer tweet-details-fixer"> … tabindex="-1">Details</a> </span> </div> </div>" data-user-id="25324805" data-name="~*Beebe♡Bluff*~" data-screen-name="UrBabygurrl" data-item-id="440556385688748032" data-tweet-id="440556385688748032" data-feedback-key="stream_status_440556385688748032"` 

也許你應該過濾通過的數據項-ID鳴叫? 如果你想檢查鳴叫每小時,一天,一週,一個月等,你應該使用cron :)

+0

我主要試圖瞭解如何進行偵聽過程:)我需要把某些類型的循環語句中的獲取tweets函數?或者它是否會自動獲取所有推文?它如何知道給定的推文是新的,並且之前未被其捕獲? –

+1

-1 [不要使用正則表達式解析HTML](http://stackoverflow.com/a/1732454/216074)。另外,Twitter提供了一個API,所以有*真的*不需要查詢Twitter網站。 – poke

+0

感謝您的建議:)我忘了Twitter API,我很愚蠢:) – ajtamwojtek