2014-02-26 12 views
0

我有一個包含網頁整個html內容的sting htmlSrc? 有什麼方法可以找到網頁的主要內容?使用Javascript查找網頁的主要內容

關於使用JavaScript的所有頁面?

+0

什麼是網頁的「主要內容」?這在每個地點都會發生變化。如果您可以在DOM中爲您希望定位的網站標識容器對象(例如,有時存在#content div或類似的東西),則可以只取出該容器的內容。 – binaryatrocity

+0

要擴展@ binaryatrocity的答案,您還應該熟悉基本的HTML/DOM結構,它們將幫助您發現訪問您的信息所需的元素。 – mattsven

+0

@ binaryatrocity.i想要找到兩個網頁之間的相似度。根據網頁內容將整個網頁內容分成兩個字符串。 – amoghpc

回答

0

如果您要查找內容,以便您可以區分兩個網站的內容,我會建議您在HTML標記中查找文本並對其進行比較。您也許可以搜索不同的標籤並解析標籤之間的文本。或者也許標籤找到標題。

相關問題