2011-06-30 53 views
0

我想抓取一個網站。
我已經使用XPATh爲標題,日期,然後文章的正文我的YQL查詢。如何獲得由給定的XPATH訂購的YQL的JSON結果

 
select * from html where url="mywebsite.com/myarticle" and xpath="headlineXpath | DateXpath | BodyXpath" 

現在在XML中的結果是標題,日期,然後正文,這就是我正在尋找。
但是當我得到json格式的結果,我得到它的另一個順序標題,身體然後日期 我的問題:我怎麼能得到結果在json根據給定的XPATHS的順序?
感謝您的幫助

+0

你能展示一個XML和JSON的例子嗎?和所需的JSON? – LarsH

回答

0

你嘗試:

select headline, date, body from html where ... 

,而不是使用*?我不太瞭解YQL,所以我可能會忽略參數,但是想法是使用顯式選擇而不是通配符來指定字段的順序。

+0

感謝Lars的回覆。 當我得到的結果以XML格式我得到的結果作爲 頭銜日期而在JSON格式我得到它 結果:{H6:標題} {P:身體} {B:日期} 現在...我在找什麼是把它作爲標題,日期,然後在JSON格式的身體 再次感謝 – Alaa

+0

@Alaa,我改變了我的答案......這有幫助嗎? – LarsH

+0

謝謝拉爾斯,非常感謝,但問題是:我構建爬蟲和標籤不是標準的(例如標題可能是h2的網站,而它可能是'強'的另一個等等) – Alaa