不幸的是,Dataproc的啓動圖像是沒有Snappy支持而構建。我已經打開了一個錯誤來修復下一張圖片。
一種解決方法:
首先創建一個小的shell腳本,妥善安裝活潑和它的本地庫的支持。爲此,我們將使用bdutil使用的相同本機庫。我打電話給我的劇本setup-snappy.sh
:
#!/bin/bash
pushd "$(mktemp -d)"
apt-get install -q -y libsnappy1
wget https://storage.googleapis.com/hadoop-native-dist/Hadoop_2.7.1-Linux-amd64-64.tar.gz
tar zxvf Hadoop_2.7.1-Linux-amd64-64.tar.gz -C /usr/lib/hadoop/
複製新的shell腳本到你自己的GCS桶內。出於演示的目的,我們假設水桶dataproc-actions
:
gsutil cp ./setup-snappy.sh gs://dataproc-actions/setup-snappy.sh
當啓動一個集羣,指定初始化動作:
gcloud beta dataproc clusters create --initialization-actions gs://dataproc-actions/setup-snappy.sh mycluster
感謝安格斯,我可以證實這一點爲我們工作!順便說一句,你的最後一個命令有一個小的錯字,它應該是'gcloud beta數據集羣創建 - 初始化 - 行動gs://dataproc-actions/setup-snappy.sh mycluster' – aeneaswiener
感謝您指出。更新了命令。 –