如何從網頁獲取信息，但不是全部？

我正在重試僅從該維基頁面中檢索文本和圖像。如何從網頁獲取信息，但不是全部？

我將有一個新聞源，並單擊我的項目時，URL將被取出。通過瀏覽器轉到網頁，我想獲取文本和圖像，並將它們輸入到textview和imageviews中。

您有幾個選項。

很明顯，在設備上解析一個巨大的頁面會比在網絡服務器上解析它慢很多，並且服務於你所需要的。

當然，如果你真的需要只是文字和圖片的，有一定的幫助，通過使用維基百科的移動版： http://mobile.wikipedia.org OR http://en.m.wikipedia.org

「移動」版本分裂的網頁了並且不包含圖形，但「m」版本可能更符合您所尋找的內容。

這裏是格式化的頁面，「其中紅色蕨類植物生長」： http://en.m.wikipedia.org/wiki/Where_the_Red_Fern_Grows

2011-08-09 20:05:49 gtcompscientist

我不想做網頁的移動版本，因爲維基心不是我將使用唯一的頁面。所以我需要按照您的建議創建或使用解析器。我如何去獲取/使用其中之一？ http sax或dom？ apache jericho？ –

你是如何實施的，取決於你和你的需求。對於我現在的大部分東西，我使用'LAMP'服務器，並且通常爲我的大部分需求提供'JSON'，但這一切都取決於您所熟悉的內容。 – gtcompscientist

有沒有教程或書籍告訴你如何使用這些？ –

回答