2015-05-27 35 views
0

我正在嘗試使用AWS機器學習SDK創建數據源。我有一個數據集及其相應的模式。兩者都存儲在S3.Initially我認爲我只需要提供架構中的列名稱。所以最初我的架構看起來像這樣 -如何通過AWS機器學習SDK創建數據源

ColName1,ColName2,....,ColNameN 

後來我意識到,我需要把數據類型爲架構不標註names.so我改變了我的架構

Number, String,....,String 

不過我不能夠由於架構不正確而創建數據源。我得到這個錯誤 -

FAILURES (1): There was an error trying to parse the schema: 'Unexpected character ('s' (code 115)): expected a valid value (number, String, array, object, 'true', 'false' or 'null') at [Source: [email protected]; line: 1, column: 2]' 

現在我認爲我需要提供JSON格式的模式,雖然我不知道,有人可以提供例如要放什麼模式?

回答

0

filename- dataset.schema(它是強制性的,以具有.schema作爲模式文件的擴展名)

{ 
    "version": "1.0", 
    "targetAttributeName": "A5", 
    "dataFormat": "CSV", 
    "dataFileContainsHeader": false, 
    "attributes": [ 
     { 
      "attributeName": "A1", 
      "attributeType": "TEXT" 
     }, 
     { 
      "attributeName": "A2", 
      "attributeType": "NUMERIC" 
     }, 
     { 
      "attributeName": "A3", 
      "attributeType": "CATEGORICAL" 
     }, 
     { 
      "attributeName": "A4", 
      "attributeType": "TEXT" 
     }, 
     { 
      "attributeName": "A5", 
      "attributeType": "BINARY" 
     } 
     ] 
    }