gora

    1熱度

    1回答

    我們計劃實現基於HBase的數據倉庫。 有多個實體有父子關係或換句話說我們有嵌套。 public class Parent { private String name; private List<Dependent> dependents; ... } 作爲每HBase的,我們可以將這些嵌套實體存儲爲值[按JSON /阿夫羅]在ColumnFamily中之一。 我們正在查看菲尼克斯

    0熱度

    2回答

    我想將mysql與hadoop中的項目集成在一起。我搜索了很多不同的方法,有兩種方法:實時使用「用於hadoop的mysql應用程序」和「apache sqoop」用於非實時用途。 我發現Gora也有這個能力,但我找不到任何有關如何去做的信息。 Gora是否真正的時間? gora和mysql applier或sqoop有什麼區別? 對於hadoop和mysql的集成,它是否需要任何nosql db

    0熱度

    1回答

    我按照nutch2教程,並與HBase的成功 我的問題是,當我在runtime/local/bin目錄使用以下命令 ./nutch crawl urls/seed.txt abc -depth 50 -topN 50抓取網址整合Nutch的, 時出錯: Exception in thread "main" java.lang.RuntimeException: job failed: name=g

    1熱度

    2回答

    我收到以下錯誤消息。我試圖連接HBase作爲Nutch爬蟲的後端。 13/10/21 13:11:13 INFO client.HConnectionManager$HConnectionImplementation: getMaster attempt 0 of 10 failed; retrying after sleep of 1000 org.apache.hadoop.hbase.Ma

    2熱度

    1回答

    我試圖運行首次Nutch的同時執行 /斌/ Nutch的產生-topN 5 我得到以下異常: GeneratorJob: starting at 2016-02-13 21:01:42 GeneratorJob: Selecting best-scoring urls due for fetch. GeneratorJob: starting GeneratorJob: filtering:

    0熱度

    1回答

    ,我米收到以下錯誤 Error: Could not find or load main class org.apache.gora.compiler.cli.GoraCompilerCLI 此之前,我得到了我後JAVA_HOME沒有設置錯誤通過設置JAVA_HOME變量解決了錯誤 OS: Cent OS 6.5 Java version : java version "1.7.0_45" Ope

    0熱度

    1回答

    如何讓giraph從多個輸入路徑讀取數據。 我在gora.properties使用該 gora.datastore.default = org.apache.gora.avro.store.Avrostore gora.avrostore.input.path =文件:///路徑/到/文件1。 avro,file:///path/to/file2.avro 但它給出了這個錯誤 輸入路徑不存在:fi

    2熱度

    1回答

    我可以使用Avro JSON規範(捆綁在Gora中)將Apache Gora作爲ORM與Accumulo進行集成。當我使用諸如String,Integer等原始數據類型時,它工作正常,但是一旦我將數據類型定義爲Array或Map,就會遇到錯誤。 在陣列的情況下,戈拉當我嘗試添加新元素引發以下錯誤:「(Ljava /郎/對象;)org.apache.gora.persistency.ListGene

    0熱度

    1回答

    我是Nutch(2.2.1)的新手,嘗試在Cygwin/Windows 7上運行最新版本的Gora(0.5),因此我可以將數據保存到MongoDB (2.6)數據存儲。我更改了Nutch-Site.XML文件以包含我的Mongo屬性,但對於需要的gora-mongodb.mapping.XML屬性文件here有點困惑。只是想知道我是否需要: 1)在我在gora-mongodb.mapping文件的

    1熱度

    1回答

    我想開始我的第一個爬工作,我已經配置了數據庫的設置,我執行以下命令:bin/nutch inject urls 而且錯誤結果如下: InjectorJob: starting at 2014-07-18 08:13:34 InjectorJob: Injecting urlDir: urls InjectorJob: Using class org.apache.gora.sql.store.