2011-02-25 43 views
1

我正在嘗試做一點第三方供應商錯誤跟蹤系統(jira)的屏幕抓圖,我可以刮所有未解決的錯誤的計數/類別。我想把這些信息放在我們的內部網上,這樣管理人員就可以在不訪問第三方網站(他們沒有登錄憑證)的情況下看到它。yql和firebug xpath複製/粘貼返回沒有結果

雖然我在獲取xpath結果時遇到了問題。這是我正在做的。使用Firebug,我選擇我感興趣的DOM元素並右鍵單擊「copy as xpath」。然後我將它粘貼到YQL控制檯中,所以我看起來像這樣:

select * 
from html 
where url='http://username:[email protected]/path/to/page_i_want.aspx' 
     and xpath='//*[@id="primary"]' 

我的JSON結果返回null。如果我在查詢中刪除xpath,我會返回結果。如果我選擇頁面上的其他元素,我的JSON結果將返回null。如果我開始調整xpath,比如刪除路徑中的最後一個div,我有時可以得到結果,這取決於我選擇的和我在xpath中調整了什麼。

任何人都知道我爲什麼沒有得到任何結果做xb的Firebug副本?我真的不能說我是一個xpath親:)

編輯:其實,看着結果我回來沒有xpath,它看起來像我沒有認證。我的用戶名中有一個@和域名,所以我通過瀏覽器登錄的東西,如:

名@域

密碼

YQL似乎並不喜歡@域和\轉義@似乎不起作用。有人有主意嗎?

回答

0

這將工作只要滿足下列條件:

該模塊將只取下1.5MB的HTML頁面和頁面也必須是可轉位(例如,通過網站的robots.txt文件允許的。) 。

由於它是在登錄後面,所以它可能不可索引。該robots.txt是公開的,如:

http://internet.com/robots.txt

以供將來參考,使用雙引號逃脫商業at符號:

'http://"[email protected]:password"@jira.3rdparty.com/path/to/page_i_want.aspx' 

這裏有一些資源: