2010-07-13 200 views
0

我試圖從公衆可以獲取的娛樂信息數據庫中獲取信息。我試圖解析的Feed是http://www.recdata.gov/feeds/RecElements/getAllRecElementsForOrgID_-1.xml(大文件)消費政府Web服務

似乎feed是一個複雜的xml文檔,它看起來好像有很多類似於數據庫中的引用表的信息引用。如何處理這個問題有什麼建議?有沒有更好的方法來消費它?我需要從Feed中獲取儘可能多的信息,並且所有的弧元素真的讓我感到沮喪。

+0

也許你可以張貼鏈接到文件,而不只是一個鏈接到一個巨大的文件。 – 2010-07-13 05:59:26

回答

1

在他們的網站有點戳,我發現他們的Web Service Manual。這表明他們爲每個服務公開了一個WSDL。用於獲取數據的服務的WSDL位於https://www.recdata.gov/RIDBWebService/RIDBService.jws?WSDL

注意XMLSPY說,這WSDL是錯誤的:

File https://www.recdata.gov/RIDBWebService/RIDBService.jws?WSDL is not valid. 
    attribute 'part' in extensibility element '<mime:mimeXml>' refers to part 'Body' which could not be found in message 'getRecGovFacilitiesHttpGetOut' 
     Error location: definitions/binding/operation/output/mime:mimeXml/@part 

所以一個處理這種服務方式是使用WSDL在你喜歡的語言生成代理類。例如,如果您使用.NET,則可以使用「添加服務引用」命令並將其指向WSDL。

+0

我可能會使用PHP,因爲我更熟悉它。處理獲取與設施ID相關的元素的最佳方法是什麼?那是我遇到麻煩的地方。 – Seth 2010-07-13 18:10:58

+0

@Seth:我認爲PHP 5.2可以處理WSDL。 – 2010-07-13 18:28:49