這不是您期待的答案,但可能會給出一個起點。
我花了一個實例,你Status
紀錄,把它放在一個text file,並運行此腳本:
# coding: utf-8
with open('status.txt') as f:
tco = f.read()
import re
re.compile("(?P<key>\w+)=(?P<value>\w+)")
expre = re.compile("(?P<key>\w+)=(?P<value>\w+)")
pairs = dict(re.findall(expre, tco))
這給你的東西是這樣的:
{'author': 'User',
'contributors': 'None',
'contributors_enabled': 'False',
'coordinates': 'None',
'created_at': 'datetime',
'default_profile': 'True',
'default_profile_image': 'False',
'favorite_count': '0',
'favorited': 'False',
'favourites_count': '46',
'follow_request_sent': 'None',
'followers_count': '204',
'following': 'False',
'friends_count': '274',
'geo': 'None',
'geo_enabled': 'True',
'id': '652242063048724480',
'in_reply_to_screen_name': 'None',
'in_reply_to_status_id': 'None',
'in_reply_to_status_id_str': 'None',
'in_reply_to_user_id': 'None',
'in_reply_to_user_id_str': 'None',
'is_quote_status': 'False',
'is_translator': 'False',
'listed_count': '91',
'location': 'None',
'notifications': 'None',
'place': 'None',
'possibly_sensitive': 'False',
'profile_background_tile': 'False',
'profile_use_background_image': 'True',
'protected': 'False',
'retweet_count': '0',
'retweeted': 'False',
'statuses_count': '9724',
'truncated': 'False',
'user': 'User',
'utc_offset': '7200',
'verified': 'False'}
現在很明顯,這缺少很多我簡單的正則表達式無法解析的信息。例如,User
對象屬性。一些json dicts也。
對於更復雜的問題,我們建議您查看parser
模塊。我會在空閒時間看到我能做些什麼來解決這個問題。看起來像一個很好的問題。
你能舉一個例子說明這些文件的外觀嗎?你是如何拯救他們的? –
我已經將它添加爲pastebin鏈接 - 行很長。他們被保存下來,只需使用'open(file,'a')'選項將它們寫入文件。 – nlsdfnbch
也許你可以嘗試在它們上運行'eval',之後從Tweepy導入相關的類,模塊? –