我是Hadoop,MapReduce,Big Data的新手,我試圖評估它對於我正在開發的項目非常有趣的特定用例的可行性。但我不確定,如果我想完成的是A)可能的或者B)推薦使用MapReduce模型。這是一個可行的MapReduce用例,甚至可能執行?
我們基本上擁有大量小部件(已知的數據結構)和定價模型(編入JAR文件),我們希望能夠做的是執行小部件和定價模型的每個組合以確定結果的模型排列中的定價。定價模型本身將檢查每個小部件,並根據模型內的決策樹確定定價。
這對我在腦海中對商品基礎設施角度的並行處理很有意義,但從技術角度來看,我不知道是否有可能在MR作業內部執行外部模型,並且從實際角度來看我是否嘗試強制使用案例進入技術。
問題因此變成了可能;以這種方式實施是否合理?如果不是更適合這種情況的其他選項/模式是什麼?
編輯 數量和品種會隨着時間而增長。爲了討論的緣故,我們假設我們目前有一個terabyte小部件和10個定價模型。隨後,我們預計會涉及多TB和100多種定價模型,並且隨着小部件更改和/或添加以及引入新類別的定價模型,排列的執行將會頻繁發生。
有趣的...你能更具體地瞭解你有多少數據? MapReduce,Hadoop和BigData都很棒,但老實說,除非你有超過TB數量的原始數據進行處理,否則它們是過量的。 –