2014-12-28 177 views
0

一個谷歌搜索「隕石」(隨機單詞)結果的準確數量返回此:在谷歌搜索

關於86,400結果。

如何獲得準確的計數?我嘗試使用rc參數是這樣的:

https://www.google.com/?q=micrometeorite&rc=1

,但它似乎並沒有工作。

回答

1

谷歌 - 以及任何理性的搜索引擎 - 對數字進行欺騙,估計有多少結果。它不一定非常適合搜索引擎。事實上,對於他們來說,實際枚舉結果的數量會很慢並且很荒謬,因爲大多數用戶不會離開第一頁或查看結果的數量。

我不確定你打算如何處理這些統計信息,但作爲一名語言學家,我建議不要使用搜索結果計數,除非知道您可能點擊多少頁的結果。他們在不公開的情況下做了很多事情。精確地說,他們也是如何索引網頁的。一般的東西是已知的,但計數如何產生的基本原理是不知道的。因此,這些數字缺乏上下文 - 他們來自哪個頁面,n正好計算出多少個網站等。

相反,我建議您查看特定的語料庫或語料庫。有語料庫 - COCAUKWAC想到最大限度地普遍 - 準備用於研究目的。如果它適合您的需求,您也可以使用Wikipedia作爲一個語料庫。

+0

謝謝,這很有趣。仍然不確定'rc'的解釋是什麼。 –

+0

他們聲稱[它確實提供了準確的搜索計數](http://www.google.com/support/enterprise/static/gsa/docs/admin/70/gsa_doc_set/xml_reference/appendices.html#1075478),但我仍然不相信它。 – Dan

+1

這是Google Search Appliance的功能。 –