我想收集來自Twitter的一些主題標籤。 閱讀中,我需要得到實體的文檔 https://dev.twitter.com/docs/platform-objects/tweets訪問列表中的項目
"entities":
{
"hashtags":[],
"urls":[],
"user_mentions":[]
}
我目前能夠訪問實體字典和哈希標籤列表
for line in iter(my_tweet_file)
tweetionary = json.loads(line)
print tweetionary["entities"]
print tweetionary["entities"]["hashtags"]
但我不能夠解析正確我對文本值感興趣(lin和Scot在下面的例子中)
[{u'indices': [41, 45], u'text': u'lin'}, {u'indices': [55, 60], u'text': u'Scot'}]
我想填充從標籤列表中提取的文本字典。
謝謝,丹尼
精確,需要什麼。從主題標籤list_中提取的文本字典 - 這個不清楚。字典意味着,它有關鍵:價值。需要什麼關鍵和價值?也許你只需要一個標籤列表? – stalk 2013-05-13 09:00:57
你如何讓你的最終字典看起來像?你能舉一些例子鍵和值嗎?目前你只有標籤,可以存儲在列表中 – 2013-05-13 09:05:22
第一步我想提取每一個hashtag,但是因爲我需要計算他們的頻率,我想這樣的字典:''代碼'freq_hash = {'lin':1,'Scot':1,'Win':3}'code' – 2013-05-13 09:06:01