-1
我使用Twitter的流API生成了一個.json文件。因此,我的.json文件有多個包含在斷開連接的json對象中的推文。在使用'jsonlint'進行驗證時,我不斷收到EOF錯誤。有沒有可能的解決這個問題的方法。我最終的目標是根據關鍵字和主題標籤直觀分析Twitter趨勢。以下是我的代碼:使用Python3解析json文件
import json
import pandas as pd
import matplotlib.pyplot as plt
tweets_data_path = 'import_requests.txt'
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
print(len(tweets_data))
tweets = pd.DataFrame()
tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
迭代:
那麼你應該得到這個
您可以通過使用列表理解修復行,使用'json.loads'加載每行' – MaxNoe
問題是當我使用map()函數在我的變量上。 –
你是什麼意思?你應該顯示代碼。 – MaxNoe