我一直在尋找rubyforge上的XML和HTML庫,以便將數據從網頁中提取出來。例如,如果我想解析一個用戶頁面上的stackoverflow我怎樣才能將數據轉換爲可用的格式?在Ruby中解析網頁的最佳方式是什麼?
假設我想解析我自己的用戶頁面以獲取當前的聲望得分和徽章列表。我試圖將從我的用戶頁面檢索到的源代碼轉換爲xml,但由於缺少div,轉換失敗。我知道我可以做一個字符串比較,並找到我正在尋找的文本,但必須有一個更好的方法來做到這一點。
我想將它合併到一個簡單的腳本中,該腳本在命令行處吐出我的用戶數據,並可能將其擴展到GUI應用程序中。
不要在你的遊行上下雨,但最優秀的http://modos.org/sof/?u = ??? (其中???是你的id,對你來說是22423)可能已經做了你想要的。有關更多詳細信息,請參閱http://stackoverflow.com/questions/61553/track-your-reputation – SCdF 2008-09-26 05:05:43