2012-07-29 32 views

回答

1

您可以使用curl或wget來獲取網頁,然後將其管理到sed以獲取各種標籤的內容。這是作爲,但這是有點你會得到,如果你正在做一個shell腳本的東西。

wget http://example.com -O - | grep \<title\>|sed "s/\<title\>\([^<]*\).*/\1/" 

會給你的標題標籤的內容。請注意,在此示例中,它爲您提供原始未解析的源代碼,因此它看起來像IANA &mdash; Example domains而不是IANA – Example domains

你有沒有考慮過使用類似Perl的東西?