我正在開發Web應用程序,其中用戶有標籤集合。我需要根據用戶標籤的相似性爲用戶創建一個建議列表。
例如,當用戶登錄到系統時,系統會獲取他的標籤並在用戶的數據庫中搜索這些標籤,並顯示具有相似標籤的用戶。例如,如果用戶1具有以下標籤[的Linux,Apache,MySQL和PHP]和用戶2具有[的Windows,IIS,PHP和MySQL]它說,用戶2分配襯用戶1具有重量的50%,因爲他具有2分相似的標籤(PHP和MySQL的)。
但是想象其中用戶1具有狀況[ASP,IIS,MS訪問]和用戶2具有[PHP,Apache,MySQL和]。在這種情況下,我的系統不建議用戶2作爲「朋友」到用戶1,反之亦然。但是我們知道這兩個用戶在工作領域有相似之處,都在Web技術(或Web編程等)上工作。因此,這就是爲什麼我需要計算機科學的分類(現在,但可能需要其他領域的分類,如醫學,物理學,數學等),這些概念被分類,因此當我搜索的ASP和相似PHP,例如,它可以說,他們有相似性,屬於成一個組(或類別)。
我希望我清楚地描述了自己的問題,但是如果解釋錯誤的話會對您的更正感到高興。
謝謝計算機科學分類
Q
計算機科學分類
4
A
回答
3
我不認爲你實際上需要一個分類。有了足夠的數據,您應該能夠在字段上執行cluster analysis並推斷標籤之間的關係。有關詳細信息,請參閱this paper on automated tag clustering。如果您不認爲基於標籤的標籤聚類和分析可以讓您儘可能地滿意,請查看Flickr。
或者,如果您認爲需要分類,請考慮使用SKOS。如果你可以將你的標籤映射到SKOS,那麼你可以對它們進行這種分析。您可能會發現兩個SKOS數據源特別有用:Library of Congress Subject Headings和DbPedia。如果您對使用SKOS有更多疑問,請嘗試SemanticOverflow。
2
如果這些條款出現在論壇或類似的東西,你可以使用Latent Semantic Analysis構建術語集。
2
生成一些使用谷歌集?這將是很難獲得更大的數據集比:
1
您需要創建標籤之間的關係。我不相信這可以自動完成。 你必須創建一個數據庫,它說sql = mysql = postgresql = oracle,asp = jsp = php等等。 這樣你創建了一些標籤組。標籤可以肯定存在多種關係。
相關問題
- 1. 計算機科學
- 2. 計算機科學數學
- 3. 計算機科學老人
- 4. 計算機科學界?
- 5. 如何學習計算機科學
- 6. 在數學科學中講計算機科學
- 7. 科學計算器
- 8. 計算機科學與信息科學有什麼區別?
- 9. 偉大的計算機科學演講
- 10. 在計算機科學的書
- 11. Edhesive AP計算機科學U1 Ex 2
- 12. 軟件工程計算機科學
- 13. ap計算機科學hw錯誤
- 14. 計算機科學的位和字節
- 15. 計算機科學發展路徑
- 16. 最佳格言計算機科學
- 17. 計算機科學單詞列表
- 18. 計算機科學入門課
- 19. 計算機科學與量子計算有多大關係
- 20. 實驗室10.1:計算機科學分配
- 21. Java科學計算器
- 22. Android科學計算器
- 23. 接下來要學什麼? - 計算機科學
- 24. pyspark streaming適合機器學習/科學計算嗎?
- 25. AP計算機科學邏輯運算符
- 26. 關於計算機科學算法eulerproject.net的替代
- 27. 有限自動機在計算機科學中的應用
- 28. 畢業設計想法 - 計算機科學
- 29. 「計算機科學與程序設計入門」適合初學者
- 30. 在java中計算科學數字
爲什麼這會變成主題? – 2010-06-07 11:20:40
也許計算機科學不是這裏的相關術語。 – anno 2010-06-07 12:57:51