我正在考慮爲TalkingPuffin Twitter客戶端添加一項功能,在該功能對用戶進行一些培訓後,它可以根據他們的預測值對傳入的推文進行排名。 Java虛擬機(Scala或Java首選)有什麼解決方案來完成這種事情?Tweet價值預測:什麼樣的分析(貝葉斯?)可能預測Twitter用戶會評價推文的價值多少?
3
A
回答
3
這樣做好吧並不容易。谷歌希望能夠做到這一點(「用戶將會看到什麼樣的鏈接」),Netflix(「他們會看重什麼電影」)等等。事實上,你可能會很好地閱讀關於winning entry for the Netflix Prize的註釋。
然後你需要提取一堆功能,就像@ hmason說的那樣。然後你需要一個適當的機器學習算法;你可能需要一個函數approximator(在你嘗試使用你的特性來預測0和1之間的值,其中1是「有史以來最好的推文」,0是「omg誰在乎」)或者一個分類器(你使用的分類器您的功能可以預測它是「好」還是「壞」推文)。
如果你選擇後者 - 這使得用戶培訓變得簡單,因爲他們只需要用「like」來分配推文(混合社交網絡隱喻),那麼你通常會在支持向量機上做得最好,其中存在fairly comprehensive Java library。
在前一種情況下,有許多技術可能值得嘗試;如果您決定使用LIBSVM庫,它們也有迴歸變量(即參數估計)。
8
這是一個分類問題,你基本上想要學習一個函數y(x),它可以預測未標記的推文「x」是屬於「有價值的」類還是屬於「無價值的」類。
最棘手這裏位不是算法(樸素貝葉斯只是計數和乘法,很容易的代碼!),但:
- 收集訓練數據
- 定義最佳特徵集
其中之一,我建議你跟蹤推文,用戶的最愛,回覆和轉推,第二,看看誰寫的推文,推文中的單詞,以及它是否包含鏈接的質量。
相關問題
- 1. 洪水貝葉斯評分創造價值超出範圍
- 2. PYMC3貝葉斯預測錐
- 3. scipy:評估貝葉斯網絡的最可能的價值和信心
- 4. 價格預測使用regreddion
- 5. 我的實際工會案例價值與預期價值有什麼區別?
- 6. 貝葉斯網絡的預測
- 7. google預測api定價
- 8. NHibernate預測 - 如何項目從協會內的價值
- 9. 貝葉斯預測,下標越界
- 10. 使用樸素貝葉斯預測新值
- 11. 谷歌分析測量協議ul(用戶語言)的價值是什麼
- 12. 價值類的scalap檢測
- 13. 工作負載預測的樸素貝葉斯分類器
- 14. 運用神經網絡預測價格
- 15. Sql多個預留和重複價值
- 16. 推新價值
- 17. 推遲評價?
- 18. 從前一天的預測:價值數據
- 19. android:valueTo代表什麼樣的價值
- 20. 什麼是價值?
- 21. 樸素貝葉斯的用法預測模型
- 22. 這是爲什麼按價值計價?
- 23. 價值分析界定
- 24. 'this'的價值是什麼?
- 25. CLOUDAMQP_URL的價值是什麼?
- 26. 什麼是angularfire的$價值?
- 27. x的價值是什麼?
- 28. HSHELL_FLASH的價值是什麼?
- 29. 1e100f的價值是什麼?
- 30. TAG的價值是什麼?