0

我對Azure中的解決方案方法有疑問。問題是如何決定使用哪些技術以及如何找到它們的最佳組合。Azure POS和天氣數據分析策略

假設我有兩個數據集,每天增長:

  1. 我有每天來我ADL商店CSV文件,它包含氣象數據的所有可能Lattitudes和Longtitudes組合和zip爲他們編碼,以及50個不同的天氣變量。

  2. 我有另一個POS數據集(銷售點),它也作爲每日CSV文件到我的ADL存儲。它包含所有零售地點的銷售數據。

所需的輸出是擁有該數據爲根據天氣銷售的AzureML預測編制辦法的文件「粉碎」,而預測是每個零售點進行,並通過PowerBI儀表盤傳遞到每個其中之一。要求不允許不同的位置查看其他位置的預測。

我的問題是:

  1. 如何選擇設置的技術嗎?
  2. 如何附加傳入的每日數據?
  3. 如何爲每個位置創建單獨的ML預測結果?

有關架構主題的任何一般指導都會受到讚賞,對於不同合適解決方案的比較的更具體的想法也是值得讚賞的。

+0

這是一個非常廣泛的徵求意見的討論主題。此外還有一個工具推薦問題(正如您正在尋求不同解決方案/技術的比較)。不幸的是,對於StackOverflow而言,這是無關緊要的。 –

回答

0

這是一個廣泛的問題。

我只能回答你ADL具體問題#2,給你在#3的提示(因爲我不知道格式是什麼)不相關天青ML:

  1. 如果您只需使用文件,將日期/時間信息添加到文件路徑名稱(文件夾或文件名中)。然後使用U-SQL文件集查詢您感興趣的範圍。如果使用U-SQL表,請使用PARTITIONED BY。欲瞭解更多詳情,請看U-SQL Reference documentation

  2. 如果您需要創建多個文件作爲輸出,你有兩個選擇:

    一個。你知道所有的文件名,爲每個文件寫一個OUTPUT語句,只爲它選擇相關的數據。

    b。你必須動態生成一個腳本,然後執行它。類似於this