我正在致力於一位匈牙利的twitter客戶端,並且我想實施一個趨勢系統。所以我有一個充滿表示推文創建日期的文本和日期(unix時間戳)的數據庫。如何從短信中計算趨勢
那麼我怎麼能創建一些類似的PHP腳本,給我10個「熱門話題」?我甚至不知道如何開始解決這個問題。
我正在致力於一位匈牙利的twitter客戶端,並且我想實施一個趨勢系統。所以我有一個充滿表示推文創建日期的文本和日期(unix時間戳)的數據庫。如何從短信中計算趨勢
那麼我怎麼能創建一些類似的PHP腳本,給我10個「熱門話題」?我甚至不知道如何開始解決這個問題。
您需要設計一種能夠告訴您趨勢的算法。
爲此,您首先需要定義趨勢是什麼,例如一個術語或一個人的名字,用於Twitter的飼料。或者甚至考慮一些推文是否被重新發布,以及發佈頻率和時間。因此,您需要分析每個Feed,提取您正在查找的信息,然後將其與時間信息結合起來以說明趨勢的發展趨勢,例如,與其他時期相比,在一段時間內或多或少地使用。
可以用正則表達式來解析twitter消息。
然後可以將關鍵字保存到數據庫中,該數據庫就像索引一樣。
然後,您可以使用像SQL這樣的數據語言從歸一化數據中獲取有關趨勢的信息。
您通常以簡單的腳本開始測試您的算法。
由於在你的問題中未定義你正在尋找什麼樣的趨勢,所以只能普遍回答這個問題。然而,一些提示:
這不是那麼簡單的任務 - 你需要從閱讀[數據挖掘]的基礎知識(http://en.wikipedia.org/wiki/Data_mining) – zerkms
可能值得一讀:http:///stackoverflow.com/questions/143781/what-is-search-twitter-coms-trending-topics-algorithm – cmbuckley
是的,我知道它應該如何工作,我只是不知道如何得到它在PHP中,或任何其他語言:S – 19greg96