2015-03-02 39 views
1

我有一大串jpeg/png圖像。我想最終運行這些神經網絡。但首先我必須矢量化圖像。因爲有大量的圖像,我打算使用python和Spark而不是軟件。使用Python的矢量圖圖像(Spark)

我是初學程序員。有人會知道一些粗略的代碼來做到這一點嗎?如果沒有這個,替代方法也將非常受歡迎!

很多人提前感謝!

+0

這是相當廣泛的!你有更具體的編程問題嗎? 「矢量化」圖像是什麼意思? – mdurant 2015-03-02 21:34:10

+0

看一看我的答案在這裏,並隨時爲它投票太:-) http://stackoverflow.com/questions/28748282/black-and-white-png-to-svg/28749734#28749734 – 2015-03-02 22:10:10

+0

要小心:Python和Spark也是軟件! – 2015-03-03 10:22:26

回答

0
  1. 在思考Spark和分佈式計算之前,先在本地機器上處理單個圖像。如果你喜歡蟒蛇,你可以使用像http://scikit-image.org/docs/dev/auto_examples/,但它在很大程度上取決於你想要達到
  2. 如果圖像的量高的東西,將它們存儲在SequenceFile HDFS上。這個問題將有助於你的代碼:Store images/videos into Hadoop HDFS
  3. 實現你大規模量化方法:使用SparkContext讀取SeqenceFile數據,把你的矢量Python實現到火花map()功能,並將其應用到所有你的分佈式集羣上的圖像。然後將數據保存回HDFS
  4. 不幸的是,對於神經網絡,您將不得不在本地運行您的算法,因爲MLlib中尚未實現NN。再次,像sklearn可能會有所幫助,如果你喜歡python:http://scikit-learn.org/stable/modules/neural_networks.html