2010-05-25 46 views
0

問題自動化刮擦以XML

我有我試圖讓轉換和整理到一個乾淨的XML文件中的YQL查詢結果。

背景

正在從世界盃,他們的痛苦,信息不是免費提供在一個易於重用格式。

所以,有點與YQL運用計謀後,我已成功地釋放出含有我後的數據所需的錶行。

的YQL查詢可瀏覽: http://query.yahooapis.com/v1/public/yql/ravingbeefsteak/worldcup2010groupliberator?diagnostics=true

這樣做的結果是一大堆錶行(查看源代碼從瀏覽器看到這個範圍內)。

我想現在把這些結果錶行,並將其轉換爲一個XML文件,並且是一個絕對的n00b我不知道從哪裏開始,或尋找什麼。

該文件還可以使用一些結構,所以工作這一點的部分將涉及創建我設想看起來類似的東西XML結構:

<teams> 
    <team> 
    <name>X</name> 
    <webpage>X</webpage> 
    <flagsrc>X</flagsrc> 
    ... 
    </team> 
</teams> 

我也需要做一個查找並替換上的數據(到什麼將成爲XML小組/網頁&團隊/ flagsrc元素中的數據)前面加上另外的數據,以這些字段,無需人工干預。

如果任何人都可以點我的我有什麼需要做使我的需求也將不勝感激現實的正確方向。

回答

1

我缺少的東西?鏈接到的文檔是已經是的一個XML文檔。

如果要將轉換爲將數據轉換爲另一種XML格式,請看XSLT。我會提供更多信息,但您並未指明您的平臺。

+0

不,我只是沒有在我的問題不夠詳細,並提供該平臺將是有益的(拍打頭部)。在ASP VB和IIS6上工作。 如果您查看提供的鏈接的源視圖,您會看到它正在輸出的只是一些HTML代碼(特別是錶行列表)。這正是我想要製作成XML以使重用數據集變得更加容易。 – thewinchester 2010-05-25 15:16:48

+0

@thewinchester - 說實話,我的答案即使在更新後也不會改變。我建議你閱讀XSLT,因爲這是一種按照你描述的方式將XML格式轉換爲另一種格式的技術。 – Oded 2010-05-25 15:54:39