我使用代理來湊這個網址的數據:CNN Article查找某些文本,並獲得完整的文本
我想獲得整個文章的文字(標題不一定)。所以,我想這一點:
$(data).find("div:contains('Across the river from Cairo')");
這港島線找到一段文字,但是當我做我的事與它myThing = $(this).text();
現在看來,這是獲得了很多不僅僅是文章。這可能與構建HTML的方式有關。如果我看源我看文章文本在p
但改變限制在div:contains
中p:contains
只得到我的前幾行(顯然)
所以我的問題是如何獲取文章全文,無論是HTML施工。我在尋找的東西(代碼),會說:使用
$someString = $(data).find("div:contains('Across the river from Cairo')").html();
使用字符串操作或任何
find.('Across the river from Cairo') and get this text and all the text underneath this text();
問題是,這會給我很多文字/圖片等,我不需要。這是oke,因爲沒有辦法解決這個問題,但是如果這個html只在文本下面找到,它確實會有所幫助。它可以很容易地限制到一定數量的文本。 – Youss
我已經有你的代碼'myThing = $(this).text();' – Youss
你可以使用:filter來過濾圖片標籤。正如你使用過text(),它將得到只在指定的DOM元素下的文本。 –