2017-01-31 62 views
0

我在CestOS6.7上使用Mongo版本2.6.12。它是非羣集的,即只安裝在一臺服務器上。如何從Linux/HDFS導入CSV文件到mongo數據庫

我的項目需要將最終輸出存儲在MongoDB中。這些文件是存儲在Linux和HDFS上的CSV文件。有人可以請指導我如何將CSV文件從Linux/HDFS導入mongo數據庫。

由於Mongoimport默認輸入爲JSON文件,因此不起作用。我想這在蒙戈外殼,它沒有

mongoimport news-output-20170125.csv --type csv 

2017-01-30T19:18:25.275-0600 SyntaxError: Unexpected identifier

+0

如果文件在Linux和HDFS,爲什麼HDFS重要嗎?無論如何,'意外的標識符'似乎不言自明。閱讀文檔...'csv解析器接受符合RFC 4180的數據' –

+0

這可能會幫助您http://stackoverflow.com/questions/27112384/moving-hdfs-data-into-mongodb – BruceWayne

+0

謝謝。我的文件都在Linux和Hdfs上。我需要一種將文件從其中任何一個導入到mongodb的方法。上面的文件是在Linux上,當我做mongoimport時發生錯誤。 – TextShilpa

回答

0

Mongoimport從Linux現在正在爲CSV文件。我從mongo-shell運行mongoimport。因此得到了錯誤。

[[email protected]**** ~]$ cat locations.csv 
Name,Address,City,State,ZIP 
Jane Doe,123 Main St,Whereverville,CA,90210 
John Doe,555 Broadway Ave,New York,NY,10010 
[[email protected]**** ~]$ pwd 
/home/mongoritter 
[[email protected]**** ~]$ mongoimport -d test -c test1 --type csv --file locations.csv –headerline 
connected to: 127.0.0.1 
2017-01-31T12:12:22.034-0600 imported 2 objects 

更多的幫助,您可以參考How to use mongoimport to import csv

現在,我會從HDFS進口檢查的方式。我見過一個蒙戈文件,或者將檢查,如果這個工程沒有https://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part-1-introduction-setup

感謝, SHILPA