0
我是新來的Apache Spark和一張簡單的地圖功能實現爲PySpark地圖不工作
from pyspark import SparkContext
sc = SparkContext('local', 'pyspark')
f = open("Tweets_tokenised.txt")
tokenised_tweets = f.readlines()
f = open("positive.txt")
pos_words=f.readlines()
f = open("negative.txt")
neg_words=f.readlines()
def sentiment(line):
global pos_words
global neg_words
pos = 0
neg = 0
for word in line.split():
if word in pos_words:
pos=pos+1
if word in neg_words:
neg=neg+1
if(pos > neg):
return 1
else:
return 0
dist_tweets=sc.textFile("Tweets_tokenised.txt").map(sentiment)
#(lambda line: sentiment(line))
dist_tweets.saveAsTextFile("RDD.txt")
基本上我讀文件(含標記化和去梗鳴叫),然後做一個簡單的正負字數在它的map函數中(第3行),但RDD.txt沒有任何內容。函數的情緒根本沒有被調用。 有人能指出錯誤
謝謝..你對改變全局變量是正確的...我得到了錯誤... – Solo