2017-05-09 123 views
1

我正在與一個學校項目一起工作,我們需要使用Python分析大型數據集。數據以圖像的形式存在(jpeg文件)。由於分析涉及圖像,因此我們將使用TensorFlow,OpenCV等。由於數據集很大,我們正在探索在EC2上運行Python並將數據集存儲在S3上。是否有任何wiki或指南可以幫助我們: 1)在EC2上設置Python(3.5)並連接到存儲文件的S3存儲桶。 2)創建一個多用戶環境,其中所有團隊成員(5個)都可以遠程訪問服務器並對數據集/文件運行測試。 我在AWS上的技能水平最好。非常感謝任何幫助。在AWS EC2上安裝Python和Jupyter

+0

使用_awscli_(http://docs.aws.amazon.com/cli/latest/userguide/installing.html)從/複製到S3 – Misha

回答

0

在較高的層面上,您可能希望使用AWS CLI,但有幾件事情需要先安裝。

  1. 創建一個帳戶並進入IAM控制檯來創建您的用戶。我假設你想將它們全部分配給同一個組,併爲它們定義一個權限策略。您只需要訪問EC2和S3。您需要有關於IAM服務的完整工作知識(相對較小)。

  2. 創建一個角色,以便您的EC2實例可以訪問S3。按照this教程。使用AWS CLI訪問您的EC2實例。安裝/開發工作流程應該非常密切地模仿linux工作流程。