我使用pyspark與Kafka接收器來處理推文流。我的應用程序的其中一個步驟包括致電Google Natural Language API以獲取每條推文的情緒分數。但是,我看到API每次處理的推文都會接到幾個電話(我在Google雲端控制檯中看到了電話號碼)。另外,如果我打印tweetIDs(映射函數內),我會得到相同的ID 3或4次。在我的應用程序結束時,推文被髮送到卡夫卡的另一個主題,我得到
我想使用Twitter流api來收集過濾的推文與一些座標,以便我可以映射它們。昨天晚上,當我收集推文時,流式API返回的Json對象中有一個座標字段,今天我試圖做同樣的事情,以進一步過濾推文,只有那些座標不爲null的推文才被選中。但是我得到的每個Json對象都沒有座標字段。我搜索谷歌和Twitter Api文檔,但無濟於事。什麼是問題,我該如何解決這個問題? 代碼: if (json_objec