2016-11-22 49 views
2

原來的蜂巢教程可在網上指的是一個名爲「pv_2008-06-08.txt」數據集:爲蜂巢教程實例數據

https://cwiki.apache.org/confluence/display/Hive/Tutorial

和當然,它在幾十個教程所有的被引用通過互聯網。但是,我無法在任何地方找到原始數據。有人知道它在哪裏嗎?

+0

https://www.quora.com/Where-can -I-find-large-datasets-open-to-the-public通過此鏈接 – TKHN

+0

對不起,但我不確定你的評論是否回答我的問題。要麼你明白我在尋找一個通用的樣本數據集(我不是:我正在尋找所提及的瀏覽量),或者我可以在你給我的鏈接列表中找到它,我看不到它。你能更精確一點嗎? – astrojuanlu

回答

0

通過給定的網站閱讀後,發現在該網站給出的例子已過時。請使用新鏈接獲取更多示例。

https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples

注意:許多下面的例子是過時的。更多最新的信息可以在LanguageManual中找到。

如果你仍然有興趣在該數據集,建議您郵寄給社會提供(請參見下面的鏈接)

http://hive.apache.org/mailing_lists.html

Hortonworks數據集:

最近我碰到這種Hortonworks數據集可用於在Hive和Pig中創建數據庫和查詢。

https://app.box.com/v/hadoopcrashcoursedata

如果你想嘗試這個數據集,這裏是鏈接使用上述數據集創建表

http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_4

+0

感謝鏈接Habi,但遺憾的是我的請求數據集不存在。 – astrojuanlu