2017-07-31 25 views
0

我正在處理一個處理地理空間數據處理的Ember應用程序。該項目的一部分是導入一個描述數據層的JSON對象,該數據層包含與數據條目對應的字段。例如,我想我正在導入一個名爲「洗衣設施」的數據層; JSON的會是這個樣子:建議基於給定標題的對象的類型

{ 
     key: "laundryFacilities", 
     label: "Laundry Facilities", 
     fields: [ 
     { 
      "label": "Name of Facility", 
      "key": "name", 
     }, 
     { 
      "label": "Number of Dryers", 
      "key": "numberDryers", 
     } 
     ] 
} 

在我的數據導入工作流的某些點,用戶必須爲每個字段指定一個類型。例如,「設施名稱」的類型將是一個字符串,「乾燥機數量」的類型將是一個整數。我希望能夠根據labelkey屬性向用戶提供建議類型,而不是強制他們指定每個字段的類型。是否有任何一種算法,包,框架等提供了基於類似於描述數據字段的標籤的定性來猜測數據類型的功能?還是有人知道另一種方式我可以實現這一點?我知道不要期望100%的準確性,但即使是粗略的猜測也是非常有用的。獎勵點數,如果它是一個Ember插件。

回答

0

最好的辦法是寫一些簡單的啓發式,並不比一堆映射到類型的關鍵字複雜得多。正如你所描述的,'數字'可能意味着一個數字類型,'名字'可能意味着'名字'類型。

通常,您正在描述分類問題。用(大概)少量的訓練例子來解決這個問題是很難解決的。如果你可以得到很多列名稱的例子,我會首先嚐試一個決策樹或邏輯迴歸,它會將某些詞作爲特徵出現,並生成一個數據類型作爲輸出變量。

相關問題