1
我需要動態獲取標題和URL描述。爲了做到這一點,我需要使用什麼?使用URL動態獲取標題和描述
就拿以下網址:http://en.wikipedia.org/wiki/Stack_overflow
我需要提取URL的瓷磚和它的描述。你喜歡jsoup提取如下?
url.select("title");
如果是,如何提取url的描述?
我需要動態獲取標題和URL描述。爲了做到這一點,我需要使用什麼?使用URL動態獲取標題和描述
就拿以下網址:http://en.wikipedia.org/wiki/Stack_overflow
我需要提取URL的瓷磚和它的描述。你喜歡jsoup提取如下?
url.select("title");
如果是,如何提取url的描述?
我認爲你需要一個像Jericho這樣的HTML解析器。
看看這個例子: http://jericho.htmlparser.net/samples/console/src/ExtractText.java
特意此兩種方法:
private static String getTitle(Source source) {
Element titleElement=source.getFirstElement(HTMLElementName.TITLE);
if (titleElement==null) return null;
// TITLE element never contains other tags so just decode it collapsing whitespace:
return CharacterReference.decodeCollapseWhiteSpace(titleElement.getContent());
}
private static String getMetaValue(Source source, String key) {
for (int pos=0; pos<source.length();) {
StartTag startTag=source.getNextStartTag(pos,"name",key,false);
if (startTag==null) return null;
if (startTag.getName()==HTMLElementName.META)
return startTag.getAttributeValue("content"); // Attribute values are automatically decoded
pos=startTag.getEnd();
}
return null;
}
什麼是URL的標題和描述?你的意思是位於給定URL的HTML頁面的標題嗎?如果是這樣,描述是什麼?哪裏可以找到? – 2012-03-31 15:38:46
是的HTML網頁的標題,從meta標籤的HTML頁面的描述... – 2012-03-31 15:46:08
您是否找到了解決方案? – jordeu 2012-04-04 17:59:06