-1
A
回答
0
如前所述,這種類型的問題不適用於SO,但由於我知道可能對您感興趣的好數據集,因此我正在共享這些信息。
- 紐約時報,CNN,BBC和四大事件新聞報道和用戶的意見發生在2014年
- 紐約時報的新聞報道和用戶的意見在2013年
用於工作 - Socially-Informed Timeline Generation for Complex Events。數據集可以從here下載。
相關問題
- 1. 文本挖掘庫或語言庫?
- 2. [R文本挖掘包:允許把新的文件到現有的語料庫
- 3. 自然語言/文字挖掘和Reddit /社會新聞網站
- 4. [R文本挖掘問題
- 5. 中文文本挖掘
- 6. 帶r庫的文本挖掘stringdist
- 7. 將IRC檔案整理成用於文本挖掘的語料庫
- 8. 文本挖掘中的R
- 9. 文本挖掘單個文本文檔
- 10. stemDocument [R文本挖掘
- 11. 文本挖掘:在Python
- 12. 的Oracle SQL導航數據挖掘文本挖掘
- 13. 文本挖掘和機器學習
- 14. Kmeans聚類和文本挖掘在R
- 15. R文本挖掘和隨機森林
- 16. 文本挖掘庫或算法來檢索所需的文本?
- 17. R - 文本挖掘 - 導入語料庫並保存文檔名稱矩陣中的文件名
- 18. 挖掘維基百科映射文本挖掘關係
- 19. 文本挖掘/分析用戶命令/問題算法或庫
- 20. 文本挖掘和主題建模之間的區別
- 21. 如何從新聞文章中提取h2和h3標題
- 22. 錯誤的文章,當點擊相同的標題的新聞文章
- 23. R採用量化的文本挖掘
- 24. 電子郵件的文本挖掘
- 25. 存儲文本數據挖掘的
- 26. 文本挖掘中的功能數
- 27. 文本挖掘中的矩陣控制
- 28. 短文本(如新聞標題)分析
- 29. 抓取新聞文章
- 30. 如何文本挖掘特定數據
自由,如「免費啤酒」?如果是這樣,我認爲你運氣不好。即使您或您的研究小組是[LDC](https://www.ldc.upenn.edu/)的一部分,也不存在「免費許可」(但需付費),AFAIK 。由於許可條款和着作權限制很嚴格,新聞難以自由分發。說實話,你可能最好是自己刮掉這些數據......但是我會很高興被證明是錯誤的! – fnl
好的。抱歉,模棱兩可。我的意思是開源。 ! –
這種類型的問題不適用於SO。然而,至少有一個數據集想到:https://archive.ics.uci.edu/ml/datasets/reuters-21578+text+categorization+collection – emilliman5