可能重複:
Looking for dataset to test FULLTEXT style searches on我在哪裏可以找到大量的文本文件?
我最近在對數據挖掘的項目,爲此我需要100 GB用於測試純文本的......我累了的搜索整天的淨。有人請通過提供我可以下載這些文本文件的鏈接幫助我。謝謝。
可能重複:
Looking for dataset to test FULLTEXT style searches on我在哪裏可以找到大量的文本文件?
我最近在對數據挖掘的項目,爲此我需要100 GB用於測試純文本的......我累了的搜索整天的淨。有人請通過提供我可以下載這些文本文件的鏈接幫助我。謝謝。
您要搜索哪種類型的文本?會話,文章,書籍 - 還是一切的好傳播?
古登堡計劃可能是一個良好的開端: http://www.gutenberg.org/
維基百科還允許您下載的文章歸檔: http://en.wikipedia.org/wiki/Wikipedia:Database_download
你想下載100GB的文本文件。 .... – vikky 2012-02-07 07:31:33
是的..!實際上超過100 GB .. 1TB是我們的目標..! – Sri 2012-02-07 07:39:31
在一個7zip文件中獲取整個gutenberg:http://www.gutenberg-tar.com/ – JoeRocc 2016-05-12 20:41:58