disco

    0熱度

    1回答

    我想修改高級教程的innerjoin-例子,使它可以使用mapreduce進行稀疏矩陣乘法(由Ullman描述)。因此,我需要第二個映射 - 減少步驟在結果矩陣中求和相等位置的值。 不幸的是,我沒有設法得到類CsvInnerJoin的第一個reduce函數的輸出到SumJob的map函數中。 import sys sys.path.append("/home/damian/disco/lib/"

    0熱度

    1回答

    我是迪斯科的新手,只是想玩弄它。所以我試圖設置documentation中描述的最簡單的實例。 Erlang和Python被安裝,我做了Git checkout,運行make並通過bin/disco nodaemon啓動Disco。您可以在下面看到啓動從站時的錯誤消息。由於我是新手,我沒有膠水可能是錯誤的以及如何調試。任何提示將非常感激。 Eshell V5.10.2 (abort with ^G

    3熱度

    2回答

    我一直在這裏以下教程:http://discoproject.org/doc/disco/start/install.html ,並已成功的最多,我運行腳本的點。我得到的錯誤: no module named disco.core 我已經安裝迪斯科根據上述說明,但這似乎並沒有安裝python庫。 我曾嘗試使用暢達,PIP它安裝,並沒有任何運氣的easy_install .. 人有什麼想法?

    0熱度

    1回答

    我最近發現迪斯科項目,真的很喜歡它與Hadoop相比,但我有一個問題。我的項目是,像這樣的設置(我會很高興地剪切/粘貼真正的代碼,如果它會幫助): myfile.py from disco.core import Job, result_iterator import collections, sys from disco.worker.classic.func import chain_re

    4熱度

    1回答

    使用Visual Studio 2010,我們有幾個網站(不是web應用程序項目)和命令行和winforms項目的解決方案。所有目標.Net 2.0。許多項目都在Web站點中提供了對ASMX Web服務的Web引用。 Web服務頻繁變化,所以當我們編譯所有東西時,我們必須手動遍歷所有項目並更新Web服務引用。我現在已經成功地使用disco.exe和wsdl.exe自動化了。但是我擔心wsdl.ex

    2熱度

    1回答

    我與DISCO例如從文件計算的話一起閱讀以下具體JSON領域: Counting Words as a map/reduce job 我沒有問題得到這個工作,但是我想嘗試從包含JSON字符串的文本文件中讀取特定字段。 的文件有像行: {"favorited": false, "in_reply_to_user_id": 306846931, "contributors": null, "trunc

    2熱度

    1回答

    我使用disco爲許多不同目的運行數十個地圖縮減作業。我的數據變得非常龐大,我想我會嘗試使用DDFS而不是標準的txt文件進行更改。 我跟着DISCO map/reduce example Counting Words as a map/reduce job,沒有太大困難,在別人的幫助下,Reading JSON specific data into DISCO我已經過去了我最近的一個問題。 我試

    0熱度

    1回答

    「沒有cookie文件的家」是什麼意思?以及如何解決這個問題: export BINDIR=/usr/lib/disco/master/ebin/;/usr/lib/erlang/erts-5.10.4/bin/beam -K true -P 10000000 -scl false -stbt s -- -root /usr/lib/erlang -progname erl -- -home /u

    1熱度

    1回答

    我的每個映射器都需要訪問非常大的字典。有沒有辦法避免每個mapper打開它自己的副本的開銷,而是讓它們都指向一個全局共享對象? 任何針對DISCO或mapreduce範例的建議都會有所幫助。

    1熱度

    1回答

    我希望將已完成的Disco作業直接寫入mongodb。有沒有簡單的方法來指定迪斯科發送其數據的輸出網址?