-3
我想修改我的文件中使用pyspark從HDFS獲取之後,然後我想將它保存在HDFS爲我寫了下面的代碼。「統一」對象有沒有屬性「saveAsTextFile」
代碼:
import subprocess
from subprocess import Popen, PIPE
from pyspark import SparkContext
cat = sc.textFile("/user/root/parsed.txt")
hrk = "@"
for line in cat.collect():
if (code == "ID"):
line =line.strip() + "|"+hrk
line.saveAsTextFile("/user/root/testsprk")
print(line)
但是當我運行的代碼,我收到以下錯誤。
錯誤:
Traceback (most recent call last):
File "<stdin>", line 30, in <module>
AttributeError: 'unicode' object has no attribute 'saveAsTextFile'
我知道有一些問題,我的線變量,但我不能夠解決它。
**'line'是'unicode'串**。它沒有'saveAsTextFile'方法,這應該從錯誤消息中顯而易見。而是打開文件進行寫入,並在那裏寫入字符串。 –