2012-09-28 68 views
2

我最終的目標是從Google Site頁面導入一些數據。 我試圖使用GDATA-python的客戶端(v2.0.17)下載特定的內容供稿:使用gdata-python-client下載Google協作平臺頁面內容提要

self.client = gdata.sites.client.SitesClient(source=SOURCE_APP_NAME) 
self.client.client_login(USERNAME, PASSWORD, source=SOURCE_APP_NAME, service=self.client.auth_service)  
self.client.site = SITE 
self.client.domain = DOMAIN 

uri = '%s?path=%s' % (self.client.MakeContentFeedUri(), '[PAGE PATH]') 
feed = self.client.GetContentFeed(uri=uri) 
entry = feed.entry[0] 
... 

導致entry.content在XHTML格式的網頁內容。但是這棵樹不包含任何來自頁面的計劃文本數據。只有html頁面結構和鏈接。

例如我的測試頁有

<div>Some text</div> 

ContentFeed項時,只DIV節點與文本=無

我調試了gdata-python-client請求/響應,並檢查了原始緩衝區中服務器的解析數據 - 內容中的任何計劃文本數據。因此它是一個Google API錯誤。

可能有一些解決方法?可能我可以使用一些常見的請求參數?這裏有什麼問題?

回答

0

此代碼對我的作品針對谷歌Apps域和GDATA 2.0.17:

import atom.data 
import gdata.sites.client 
import gdata.sites.data 

client = gdata.sites.client.SitesClient(source='yourCo-yourAppName-v1', site='examplesite', domain='example.com') 
client.ClientLogin('[email protected]', 'examplepassword', client.source); 

uri = '%s?path=%s' % (client.MakeContentFeedUri(), '/home') 
feed = client.GetContentFeed(uri=uri) 
entry = feed.entry[0] 
print entry 

考慮,這幾乎等同於你的,但它可能會幫助您證明或反駁的東西。祝你好運!

相關問題