2011-08-09 25 views

回答

1

您有幾個選項。

  • 主持一箇中介站點,解析鏈接並傳回您想要的數據。
  • 獲取所有頁面,並在設備上解析。

很明顯,在設備上解析一個巨大的頁面會比在網絡服務器上解析它慢很多,並且服務於你所需要的。

當然,如果你真的需要只是文字和圖片的,有一定的幫助,通過使用維基百科的移動版: http://mobile.wikipedia.org OR http://en.m.wikipedia.org

「移動」版本分裂的網頁了並且不包含圖形,但「m」版本可能更符合您所尋找的內容。

這裏是格式化的頁面,「其中紅色蕨類植物生長」: http://en.m.wikipedia.org/wiki/Where_the_Red_Fern_Grows

+0

我不想做網頁的移動版本,因爲維基心不是我將使用唯一的頁面。所以我需要按照您的建議創建或使用解析器。我如何去獲取/使用其中之一? http sax或dom? apache jericho? –

+0

你是如何實施的,取決於你和你的需求。對於我現在的大部分東西,我使用'LAMP'服務器,並且通常爲我的大部分需求提供'JSON',但這一切都取決於您所熟悉的內容。 – gtcompscientist

+0

有沒有教程或書籍告訴你如何使用這些? –