有沒有簡單的方法來保存谷歌Ngram結果 http://books.google.com/ngrams/ 作爲csv?將Google NGram結果保存爲.csv
所以,我得到這樣
1900 peace 500000times
1901 peace 540000times
等的列表?
我下載了他們的原始數據,但不知道如何處理它。當我在OpenOffice中打開這些csv時,我甚至看不到一個單詞。
有沒有簡單的方法來保存谷歌Ngram結果 http://books.google.com/ngrams/ 作爲csv?將Google NGram結果保存爲.csv
所以,我得到這樣
1900 peace 500000times
1901 peace 540000times
等的列表?
我下載了他們的原始數據,但不知道如何處理它。當我在OpenOffice中打開這些csv時,我甚至看不到一個單詞。
不,你必須去their datasets,這將是令人生畏的找到你想要的,或者你可以嘗試微軟研究院的N-Gram service。
它可以完成,而且其實很簡單。在Google Ngram查看器中生成所需的圖形,然後使用瀏覽器的功能顯示頁面源代碼(這可能在高級或開發人員選項下隱藏)。然後在代碼中(可能在第297行),您會發現簡單列出的數據。您可以使用任何文字處理器和/或電子表格軟件來清理數據並將其導出爲CSV格式。
我使用Notepad ++替換選項以在正則表達式模式下用\ n替換所有「,」。這將所有數據放入單個列中,因此您可以在任何其他文本文件中打開應用程序。 – ElPresidente