2011-04-08 34 views
2

我正在做一個Java應用程序,在那裏我需要確定什麼是通過Twitter搜索獲得的特定推文集合中的趨勢主題。在網絡搜索過程中,我發現算法定義了一個主題趨勢,當它在特定時間內提到大量提及時,即在確切的時刻。所以必須進行衰減計算,以便話題經常變化。但是,我還有一個疑問:在特定的推文集合中定義趨勢的主題

Twitter如何確定推文中的哪些特定條款應該是TT?例如,我發現大多數TT都是標籤或專有名詞。這有意義嗎?還是他們分析所有單詞並確定頻率?

我希望有人能幫助我!謝謝!

回答

1

我不認爲任何人都知道除了Twitter,但是看起來hashtags確實起到了很大的作用,但還有其他因素在起作用。我認爲挖掘整個文本需要的時間比所需的時間多,並且會導致太多的誤報。

下面是來自Mashable感興趣的文章:

http://www.sparkmediasolutions.com/pdfs/SMS_Twitter_Trending.pdf

-Ralph溫特斯

+0

非常感謝您的幫助!但是我真的很喜歡專有名詞的部分。你有這方面的任何信息嗎?也許他們做了一些提振! – 2011-04-08 19:04:41

+0

要考慮的另一件事是字符串相似性比較。如果熱門話題是「哈利波特」,你可以看到「哈利波特」,「哈利是波特」,以及熱門話題中的大量類似搜索結果。我在搜索過程中發現了一個[趨勢科技惠普](http://www.scribd.com/doc/48665388/Trends-in-Social-Media-Persistence-and-Decay)。這是一個有點數學,但你可能想給它一個 – emrahgunduz 2011-04-09 10:37:56

+0

@Lais - 沒有關於這方面的信息。然而,正如文章所表明的那樣,新聞中最近的名字被認爲是非常熱門的話題,所以我不會爲這些類型的名詞的推動而感到驚訝。 – 2011-04-15 19:46:59

0

您可能感興趣的meme tracking,其中我記得,做有趣的事與專有名詞,但基本上識別流中的話題越來越少:

而在Eddi,基於交互式主題的社交狀態流瀏覽

相關問題