2017-04-27 67 views
1

我正在使用Apache Jena將.csv文件轉換爲.rdf。我使用model.read(pathFile),但它只從本地文件系統讀取文件。我想從hdfs中讀取,例如model.read(hdfs://....),但它會給出錯誤。如何使用Jena從HDFS讀取文件並將其轉換爲Rdf?

My code

和錯誤是:在線程

異常 「主」 org.apache.jena.riot.RiotNotFoundException:未發現:HDFS://本地主機:54310 /用戶/ hduser /demo/departments/part-00000.csv

我該怎麼辦?

謝謝你的幫助。

+0

你能告訴我們你的代碼和你得到什麼錯誤嗎? – vefthym

+0

@vefthym我在下面添加我的代碼 – Ken

+1

請編輯您的問題與這些細節。不要添加不是答案的答案。現在,我爲你做到了。將來會遵循這種做法。 – vefthym

回答

1

您需要在StreamManager上添加一個Locator來處理「hdfs://」。

Jena沒有附帶讀取HDFS URL的代碼。

+0

感謝您的回答。但我有一個問題,你可以使用Spark來運行ConverDept()方法來加速執行嗎? – Ken

相關問題