disco

0熱度

1回答

我想修改高級教程的innerjoin-例子，使它可以使用mapreduce進行稀疏矩陣乘法（由Ullman描述）。因此，我需要第二個映射 - 減少步驟在結果矩陣中求和相等位置的值。不幸的是，我沒有設法得到類CsvInnerJoin的第一個reduce函數的輸出到SumJob的map函數中。 import sys sys.path.append("/home/damian/disco/lib/"

0熱度

1回答

最簡單的迪斯科設置（基於教程）無法啓動

我是迪斯科的新手，只是想玩弄它。所以我試圖設置documentation中描述的最簡單的實例。 Erlang和Python被安裝，我做了Git checkout，運行make並通過bin/disco nodaemon啓動Disco。您可以在下面看到啓動從站時的錯誤消息。由於我是新手，我沒有膠水可能是錯誤的以及如何調試。任何提示將非常感激。 Eshell V5.10.2 (abort with ^G

3熱度

2回答

沒有模塊名爲disco.core

我一直在這裏以下教程：http://discoproject.org/doc/disco/start/install.html ，並已成功的最多，我運行腳本的點。我得到的錯誤： no module named disco.core 我已經安裝迪斯科根據上述說明，但這似乎並沒有安裝python庫。我曾嘗試使用暢達，PIP它安裝，並沒有任何運氣的easy_install .. 人有什麼想法？

0熱度

1回答

迪斯科鏈跳過減少

我最近發現迪斯科項目，真的很喜歡它與Hadoop相比，但我有一個問題。我的項目是，像這樣的設置（我會很高興地剪切/粘貼真正的代碼，如果它會幫助）： myfile.py from disco.core import Job, result_iterator import collections, sys from disco.worker.classic.func import chain_re

4熱度

1回答

由WSDL.exe生成的Web服務代理代碼與「更新Web引用」 - 我應該注意嗎？

使用Visual Studio 2010，我們有幾個網站（不是web應用程序項目）和命令行和winforms項目的解決方案。所有目標.Net 2.0。許多項目都在Web站點中提供了對ASMX Web服務的Web引用。 Web服務頻繁變化，所以當我們編譯所有東西時，我們必須手動遍歷所有項目並更新Web服務引用。我現在已經成功地使用disco.exe和wsdl.exe自動化了。但是我擔心wsdl.ex

2熱度

1回答

Python的 - 的Map/Reduce - 我如何使用DISCO數字例如

我與DISCO例如從文件計算的話一起閱讀以下具體JSON領域： Counting Words as a map/reduce job 我沒有問題得到這個工作，但是我想嘗試從包含JSON字符串的文本文件中讀取特定字段。的文件有像行： {"favorited": false, "in_reply_to_user_id": 306846931, "contributors": null, "trunc

2熱度

1回答

從DDFS讀取數據ValueError：沒有可以解碼的JSON對象

我使用disco爲許多不同目的運行數十個地圖縮減作業。我的數據變得非常龐大，我想我會嘗試使用DDFS而不是標準的txt文件進行更改。我跟着DISCO map/reduce example Counting Words as a map/reduce job，沒有太大困難，在別人的幫助下，Reading JSON specific data into DISCO我已經過去了我最近的一個問題。我試

0熱度

1回答

Erlang沒有Cookie文件的家

「沒有cookie文件的家」是什麼意思？以及如何解決這個問題： export BINDIR=/usr/lib/disco/master/ebin/;/usr/lib/erlang/erts-5.10.4/bin/beam -K true -P 10000000 -scl false -stbt s -- -root /usr/lib/erlang -progname erl -- -home /u

1熱度

1回答

如何在DISCO中的映射器之間獲得共享的全局對象

我的每個映射器都需要訪問非常大的字典。有沒有辦法避免每個mapper打開它自己的副本的開銷，而是讓它們都指向一個全局共享對象？任何針對DISCO或mapreduce範例的建議都會有所幫助。

1熱度

1回答

爲迪斯科mapreduce作業指定輸出uri

我希望將已完成的Disco作業直接寫入mongodb。有沒有簡單的方法來指定迪斯科發送其數據的輸出網址？