2015-10-10 34 views
0

我試圖建立的與地震有關文檔的語料庫。我想下載所有關於該事件的新聞文章。我的問題是使用谷歌搜索(stackoverflow.com/questions/...)給出偏置對於什麼是現在revelant。相反,我希望所有文章不論時間或相關性。獲取相關查詢所有文章沒有偏見

回答

1

問題是Google試圖猜測什麼是最相關的搜索結果爲用戶輸入您的查詢,並且您對所有這些都感興趣。

你會被報紙上的文章數據庫,在這種情況下提供更好的服務比由谷歌。如果您目前在大學入學,請向圖書館索取這種資源。如果你有機會獲得這樣的數據庫,你將能夠搜索包含特定關鍵字的每一篇文章,以及一些搜索形式,甚至可以讓你通過發佈者過濾器,按日期,按地理位置,等等

Eureka.cc是這樣的數據庫的一個例子。

一些報紙的網站會給您可以訪問他們的文章歸檔。 New York Times就是其中之一。

Here is a result searching in their article database for "earthquake".

More info about newspaper article databases