我有一個數據集的單詞和文本,我想使集羣(通過K均值)或任何其他無監督/監督學習方法來區分單詞,例如,單詞'約翰'將被分類作爲一個名稱(並將與其他人的名字聚集在一起),'巴西'作爲一個地方等等。 有沒有我可以用來解決問題的模型。 我聽說過的n-gram,但我不知道如何繪製在X,Y情節或等
P.S的n元語法的概率,如果你有這將是美妙的文本挖掘和機器學習
-4
A
回答
0
如何word2vec和嵌入物的例子?
https://deeplearning4j.org/word2vec
+0
如果您沒有預定義的類,則word2vec是一個很好的解決方案。這裏你是tensorflow中的解決方案https://www.tensorflow.org/versions/r0.11/tutorials/word2vec/index.html你可以用矢量的形式表示單詞,然後使用例如餘弦距離做羣集。如果你有預定義的課程,那麼你必須使用監督學習。 – Rob
相關問題
- 1. 機器學習的挑戰:在Java/Groovy中(數據挖掘,機器學習)
- 2. 統計,機器學習和數據挖掘
- 3. 保持最新AI,機器學習和數據挖掘
- 4. R文本挖掘和隨機森林
- 5. 過慢或出在機器學習/數據挖掘內存的問題
- 6. 中文文本挖掘
- 7. 是否有任何數據挖掘/文本挖掘/機器學習技術來找到最合適的標籤對文檔進行
- 8. 如何使用機器學習算法識別URL中的新模式(文本挖掘)
- 9. [R文本挖掘問題
- 10. stemDocument [R文本挖掘
- 11. 文本挖掘:在Python
- 12. 文本挖掘中的R
- 13. Kmeans聚類和文本挖掘在R
- 14. 挖掘維基百科映射文本挖掘關係
- 15. 的Oracle SQL導航數據挖掘文本挖掘
- 16. 文本挖掘單個文本文檔
- 17. 引用url地址學習數據挖掘算法C5.0
- 18. 在學習數據挖掘與蟒蛇CH5錯誤
- 19. 基本機器學習
- 20. 機器學習形狀和類型的機器學習
- 21. NLP /機器學習文本比較
- 22. 無機器學習的文本分類
- 23. 機器學習文本分類
- 24. 哪種語言最適合數據挖掘和機器學習? Python,Java,C++還是其他?
- 25. 概率和機器學習
- 26. 我應該學習AI和數據挖掘的東西的哪一套python庫
- 27. 機器學習在Python:scikit學習/ Pybrain
- 28. 深度學習與機器學習
- 29. R採用量化的文本挖掘
- 30. 如何文本挖掘特定數據
如果你只關心「名稱」和「地點」,你應該尋找命名實體解決方案。否則,您可能希望找到/開發標籤數據(包含您關心的標籤)的良好來源,並根據該標籤學習分類器。 – greeness
您正在描述*監督*任務,分類。 –
我想對數據進行聚類,然後制定決策邊界,以便能夠近似字類型(羣集將最終標記爲類) – DavidOooO