原來的蜂巢教程可在網上指的是一個名爲「pv_2008-06-08.txt」數據集:爲蜂巢教程實例數據
https://cwiki.apache.org/confluence/display/Hive/Tutorial
和當然,它在幾十個教程所有的被引用通過互聯網。但是,我無法在任何地方找到原始數據。有人知道它在哪裏嗎?
原來的蜂巢教程可在網上指的是一個名爲「pv_2008-06-08.txt」數據集:爲蜂巢教程實例數據
https://cwiki.apache.org/confluence/display/Hive/Tutorial
和當然,它在幾十個教程所有的被引用通過互聯網。但是,我無法在任何地方找到原始數據。有人知道它在哪裏嗎?
通過給定的網站閱讀後,發現在該網站給出的例子已過時。請使用新鏈接獲取更多示例。
https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples
注意:許多下面的例子是過時的。更多最新的信息可以在LanguageManual中找到。
如果你仍然有興趣在該數據集,建議您郵寄給社會提供(請參見下面的鏈接)
http://hive.apache.org/mailing_lists.html
Hortonworks數據集:
最近我碰到這種Hortonworks數據集可用於在Hive和Pig中創建數據庫和查詢。
https://app.box.com/v/hadoopcrashcoursedata
如果你想嘗試這個數據集,這裏是鏈接使用上述數據集創建表
感謝鏈接Habi,但遺憾的是我的請求數據集不存在。 – astrojuanlu
https://www.quora.com/Where-can -I-find-large-datasets-open-to-the-public通過此鏈接 – TKHN
對不起,但我不確定你的評論是否回答我的問題。要麼你明白我在尋找一個通用的樣本數據集(我不是:我正在尋找所提及的瀏覽量),或者我可以在你給我的鏈接列表中找到它,我看不到它。你能更精確一點嗎? – astrojuanlu