2013-12-13 26 views
1

我目前正在讀Hodoop在行動書,在這本書中最重要的例子是解釋專利數據在Hadoop中例如設置

4.1 Getting the patent data set 

我試圖得到一些CSV文件from this link,我無法做到這一點我可以下載的所有包含tpt文件的.zip文件。書上說有一些我無法得到的csv文件。更多我無法理解「專利引用數據」 如果有人讀了這本書,並且對這個例子有一些理解,請幫忙。

在此先感謝。

回答

2

在下載鏈接的表中,有3個:純文本文件,.tpt壓縮文件和ASCII csv壓縮文件,右邊一個。您需要的兩個文件爲:acite75_99apat63_99

第一個文件只包含兩個字段,第一個是第二個字段的id爲專利的id。至於第二個文件,它包含有關每個專利的更多信息:授予年份,國家...

+0

謝謝,它使場景.... – Adelin