2016-09-16 49 views
4

我已經在本地安裝了PredictionIO,使用通用建議模板對本引擎進行了培訓,我根據自己的需求對其進行了修改,一切都很正常。在生產中使用PredictionIO

現在我知道這可以滿足我的需求,但我希望將它部署到生產環境中,但不幸的是,沒有太多有關它的文檔。

理想情況下,我想將所有部署在AWS上的文檔都有描述它的一部分,但是因爲CloudFormation模板被禁用,所以無用。

我想使用也許使用泊塢窗來實現它,但是我認識不足對整個堆棧,並想了解以下信息:

  • 應該在哪裏的數據儲存在哪裏?hbase似乎是「數據庫」,將它放在與其他服務器(事件服務器,預測服務器)相同的服務器上並不危險嗎?

  • 它是如何縮放的?我是否需要在負載均衡器後面運行PredictionIO的多個實例或足夠嗎?如果是的話,該如何實現?

  • 什麼是良好的分佈式架構?爲了擴展,我敢肯定,我們需要將EventServer與PredictionServer分開,這樣做的好方法是什麼?

希望有人能幫助。謝謝。 Cyril

回答

3
  1. 數據應存儲在哪裏?

PredictionIO網站:

如果您決定HBase的安裝到其他位置,則必須編輯 PredictionIO-0.10.0-孵化/ conf目錄/ pio-env.sh和更改PIO_STORAGE_SOURCES_HBASE_HOME變量指向您自己的HBase安裝。

在網頁

對於生產部署還提到,運行一個完全分佈式HBase的配置。

  1. 它是如何縮放的?

有一個在predition-io google group他們打破縮放成單獨的部件一個偉大的答案

  • 有什麼好的分佈式架構?
  • ,以規模化,我敢肯定,我們需要將事件服務器從PredictionServer分開,什麼是做到這一點的好辦法嗎?

    分離攝取層,處理層和服務層通常被認爲是很好的做法,但您需要注意不要過度工程。這很大程度上取決於您的具體使用情況,不要忘記,您所做的每個分離都會給系統增加更多複雜性(部署,監控等)。