2015-09-17 41 views
0

我將OpsCenter從5.1.3升級到5.2.0(然後升級到5.2.1)。我有一個計劃備份到本地服務器和升級前配置的S3位置,這與OpsCenter 5.1.3一起工作良好。在升級期間或之後,我沒有更改計劃的備份。無法使用OpsCenter備份到S3 5.2.1

升級後的第三天,S3備份失敗。在opscenterd.log中,我看到這些錯誤:

2015-09-28 17:00:00+0000 [local] INFO: Instructing agents to start backups at Mon, 28 Sep 2015 17:00:00 +0000 2015-09-28 17:00:00+0000 [local] INFO: Scheduled job 458459d6-d038-41b4-9094-7d450e4bac6f finished 2015-09-28 17:00:00+0000 [local] INFO: Snapshots started on all nodes 2015-09-28 17:00:08+0000 [] WARN: Marking request d960ad7b-2ccd-40a4-be7e-8351ac038c53 as failed: {'sstables': {u'solr_admin': {u'solr_resources': {'total_size': 155313, 'total_files': 12, 'done_files': 0, 'errors': [u'{:type :opsagent.backups.destinations/destination-not-found, :message "Destination missing: 62f5a26abce7463bad9deb7380979c4a"}', u'{:type :opsagent.backups.destinations/destination-not-found, :message "Destination missing: 62f5a26abce7463bad9deb7380979c4a"}', u'{:type :opsagent.backups.destinations/destination-not-found, :message "Destination missing: 62f5a26abce7463bad9deb7380979c4a"}',爲簡潔起見縮短。

當我編輯計劃的備份作業時,S3位置不再出現在OpsCenter中。當我嘗試重新添加S3的位置,使用相同的桶和憑證之前,我得到以下錯誤:

Location validation error: Call to /local/backups/destination_validate timed out.

另外,我不知道這是否是相關的,但出於完整性,我看到一些這些錯誤在opscenterd.log還有:

WARN: No http agent exists for definition file update. This is likely due to SSL import failure.

我得到這個行爲有兩種DataStax企業4.5.1或4.7.3。

回答

1

嘗試將remote_backup_region屬性添加到「cluster-name」.conf中[agents]標題下的集羣配置文件。有效值爲:us-standard,us-west-1,us-west-2,eu-west-1,ap-northeast-1,ap-southeast-1

這有幫助嗎?

+0

我在opscenter/conf/clusters/local.conf文件中添加了該節並重新啓動了opscenter,但它沒有任何區別,並且我得到了相同的錯誤消息。 – LHWizard

+0

我覺得這個信息對於5.2是不正確的。請參閱[文檔](http://docs.datastax.com/en/opscenter/5.2/opsc/configure/opscConnectionConfig_r.html)。節是[代理],我們東1不接受。它應該是我們的標準,而不是'指定的無效S3區域:us-east-1。有效選項爲:us-standard,us-west-1,us-west-2,eu-west-1,eu-central-1,ap-southeast-1,ap-southeast-2,ap-northeast-1, sa-east-1'這也沒有解決我的問題。 – LHWizard

+0

嗨,這是在黑暗中的一槍。我們是否爲您準備了標準工作? –

2

自更新到OpsCenter 5.2.x後,我一直有完全相同的問題,只是能夠正常工作。

我刪除了上一個答案中提出的所有設置,然後在us-west-1,us-west-2和us-standard中創建了新桶。在此之後,我能夠成功地將所有這些目標快速輕鬆地添加到目標中。

在我看來,問題在於OpsCenter可能試圖列出最初配置的存儲桶中的對象,在我的情況下,對於我們使用的2個現有存儲中的對象,分別有11TB和19GB數據。

這可以解釋爲什麼增加一些工作而不是其他人的超時。

希望這會有所幫助。

+0

我能夠通過刪除我的存儲桶中的快照文件夾來解決此問題。能夠毫無問題地重複使用相同的存儲桶。 – LHWizard

0

該問題已通過兩件事的結合解決。

  1. 刪除現有S3存儲桶的全部內容(或者像@ kaveh-nowroozi先前建議的那樣創建一個新存儲桶)。
  2. 編輯/etc/datastax-agent/datastax-agent-env.sh並按照DataStax工程師的建議將堆大小增加到512M。默認設置爲128M,並且在備份成功之前我一直保持其翻倍。