distributed-computing

    3熱度

    3回答

    卡夫卡DOC給出的方法有關與下面的描述: 一個消費者,每主題:一個簡單的選擇是給每個線程提供自己的消費>實例。 我的代碼: public class KafkaConsumerRunner implements Runnable { private final AtomicBoolean closed = new AtomicBoolean(false); private f

    0熱度

    1回答

    以我軟件獲取數據I從一個流中讀取信息X與過程(另一個進程的標準輸出),那麼我發送讀取到其他N-1的信息進程和最後我收集的所有數據由N進程收集。 現在我的問題是:「什麼是共享從流程之間的流讀取的信息最有效的方式?」 PS。進程也可能在通過網絡連接的不同計算機上。 在這裏,我列出一些可能性: 流(中號線)的計數線路,保存到Ñ文件M/N 線和發送到每個處理1文件。 計數行數據流(M行),分配足夠的內存來

    0熱度

    1回答

    分佈式系統中的時鐘同步。 是什麼樣的內部同步和分佈式系統外部同步之間的差異?

    1熱度

    1回答

    我正在讀關於Boost UUID的內容。我明白生成UUID有多種方式,這由UUID的版本字段決定。 This document顯示5個不同版本的UUID。 Boost UUID API允許您爲其版本查詢UUID。但是,如何設置版本?該Boost documentation page只顯示了一個創建UUID的方式,具體如下 - boost::uuids::uuid u = boost::uuids:

    6熱度

    1回答

    我使用COMPS運行COMPSs Sample Application Manual中顯示的增量應用程序。我已經添加-m標誌啓用監控功能: $ runcompss -m --debug increment.Increment 5 1 2 3 應用程序運行並正確地完成(在STD輸出/錯誤和.COMPSs文件夾內的runtime.log顯示任何錯誤還沒有得到任何堆棧跟蹤)。 我也開始了COMPSs

    1熱度

    2回答

    我最近有一些採訪,被問及一些規模問題是很正常的。 例如,您有一長串單詞(dict)和字符列表作爲輸入,設計一個算法來找出在dict中包含char列表中所有字符的最短單詞。然後面試官問如何將你的算法擴展到多臺機器上。 另一個例子是你已經設計了一個城市十字路口的交通燈控制系統。你如何將這個控制系統擴展到有許多交叉點的整個城市。 我總是不知道這種「規模」問題,歡迎提出任何建議和意見。

    2熱度

    4回答

    我很好奇分佈式與多代理系統之間的差異。我看到很多有趣的相似之處,我的頭腦也很混亂。 相似點: 1-有多個處理單元 2-兩者都用於計算和仿真應用 -3-處理單元交互 4-處理單元集體努力併成爲強大的機器 5-單位工作與自己的屬性,如自己的具體時鐘,自己特定的處理器速度,自己的內存等。 所以有什麼區別?

    0熱度

    1回答

    據瞭解,YARN可以執行/運行各種應用程序,例如MapReduce,hive,pig,hbase,impala,spark等。我想知道一個完整的除了上面提到的以外,可以在Hadoop YARN數據處理環境上運行的各種類型的應用程序。謝謝! 注意:這個問題更多的是關於可以在YARN中執行的非hadoop-stack分佈式應用程序。

    4熱度

    1回答

    運行用pyCOMPSs實現的應用程序時出現錯誤。該應用程序運行良好,但我在應用程序中做了一些更改,並且它已停止工作。這是堆棧我從應用程序得到: --- START OF NESTED EXCEPTION STACK TRACE --- *** stack trace of GATInvocationException --- START OF NESTED EXCEPTION STAC

    2熱度

    2回答

    我一直在閱讀最近關於拜占庭容錯的許多論文。有一個常見的證據表明需要3m + 1臺計算機來處理拜占庭故障。一般的證明是這樣的: 有三個 「將軍」:A,B和C.假設這樣的將領溝通,其中C是 「叛徒」: A --> B "Attack", A --> C "Attack" B --> A "Attack", B --> C "Attack" C --> A "Attack", C --> B "Re